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مشاريع تعلم عميق تم حلها باستخدام شبكات الخصومة التوليدية GANS‏ 


ترجمه واعداد: 


^62X5 ile .3 


ds‏ شبكات الخصومة التوليدية Generative Adversarial Networks (GANS)‏ واحدة من 

أكثر المواضيع إثارة للاهتمامني التعلم الآلي اليوم. لقد تم استخدامهاني عدد من المشكلات (وليس 

فقط لإنشاء أرقام (IMNIST‏ وكان أداؤها Lor‏ للغايةفي كل حالة. تتكون شبكة GAN‏ من مولد 
generator‏ ومميز discriminator‏ يتنافسان ضد بعضهما البعض لتحقيق نتائج مذهلة. 


تعتمد شبكات GAN‏ على سيناريو يشبه اللعبة حيث يلعب المولد والمميز ضد بعضهما البعض. 
يحاول المولد إنشاء بيانات تشبه البيانات الحقيقيةء بينما يهدف المميز إلى التمييز بين البيانات 
الحقيقية والمزيفة. 


تم تطبيق شبكات GAN‏ على العديد من Gly libs‏ ذلك توليد الصور والتنبؤ بالفيديو 
وإنشاء الكائنات ثلاثية الأبعاد.. تحل شبكات GAN‏ العديد من المشكلات وتخلق فرصا جديدةفي 
صناعات متعددة.ني هذ الكتاب» سوف نستكشف ما هى شبكات GAN‏ ,ومعماريتهاء ودوال الخطأء 
dall is dle‏ من المشاريم امكل شيكات GAN‏ 

لقد حاولت قدر المستطاع ان اترجم المقالات والمشاريع الأكثر طرحأني مجال شبكات الخصومة 
التوليدية GANS‏ مع الشرح المناسب والكافيء ومع هذا يبقى عملاً بشرياً يحتمل النقص. فاذا كان 
لديك أي ملاحظات حول هذا الكتاب. فلا تتردد بمراسلتنا عبر بريدنا الالكتروني 
alaa.taima(a)qu. edu.iq‏ . 


نأمل ان يساعد هذا الكتاب كل من يريد ان يدخلفي مجال التعلم العميق وشبكات الخصومة التوليدية 
ومساعدة القارئ العربي على تعلم هذا المجال. اسأل الله التوفيقفي هذا العمل لأثراء المحتوى العربي 
الذي يفتقر أشد الافتقار إلى محتوى جيد ورصينني مجال التعلم SY‏ والتعلم العميق وعلم البيانات. 
ونرجو لك الاستمتاع مع الكتاب ولا تنسونا من صالح الدعاء. 
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Networks(GANs) 
إنشاء مخرجات على البيانات غير‎ LAS TY هناك العديد من الطرق التي يمكن من خلالها تعليم‎ 
مرحلة‎ GOW المرئية. لقد ترك التقدم التكنولوجيني مختلف القطاعات الجميعفي حالة صدمة. نحن‎ 
قوية جدا بحيث‎ neural networks والشبكات العصبية‎ deep learning أصبح فيها التعلم العميق‎ 
على بعض‎ tly يمكنها إنشاء وجه بشري جديد من الصفر لم يكن موجودًا من قبل ولكنه يبدو حقيقيًا‎ 
Generative (شبكة الخصومة التوليدية‎ GAN البيانات المدرية. هذه التقنية ليست سوى‎ 

(Adversarial Network‏ وهي موضوع دراستنا. 
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Ian عام 2014 على يد إيان جودفيلو‎ (GANS) تم تطوير شبكات الخصومة التوليدية‎ 
generative modeling الأساس طريقة للنمذجة التوليدية‎ GAN وزملائه. تعد‎ 1117 
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على كتلتين رئيسيتين (شبكتين عصبيتين) تتنافسان مع بعضهما البعض وتكونان‎ GAN شبكات‎ 
قادرين على التقاط ونسخ وتحليل الاختلافاتفي مجموعة البيانات. يُطلق على النموذجين عادة اسم‎ 
وسنغطيهماني المكونات الموجودة على شبكات‎ Discriminator والمميز‎ Generator المولد‎ 
دعونا نقسمه إلى ثلاثة أجزاء منفصلة:‎ «GAN لفهم مصطلح‎ .GAN 

e‏ التوليدي pled :Generative‏ نموذج توليدي» يصف LAS‏ إنشاء البيانات من حيث 

النموذج الاحتمالي. بكلمات بسيطةء يشرح كيفية إنشاء البيانات بشكل مرئي. 

:AdversarialàáoguaAJl e‏ يتم تدريب النموذج في بيئة عدائية. 

٠‏ الشبكات Networks‏ استخدم الشبكات العصبية العميقة لأغراض التدريب. 
تأخذ شبكة المولد generator network‏ مدخلات عشوائية (ضوضاء noise‏ عادة) وتقوم بإنشاء 
عينات samples‏ مثل pal‏ أو النصوص أو em all‏ التي تشبه بيانات التدريب التي تم تدريبها عليها. 
الهدف من المولد هو إنتاج عينات لا يمكن تمييزها عن البيانات الحقيقية. 
ومن ناحية أخرى. تحاول شبكة المميز discriminator network‏ التمييز بين العينات الحقيقية 
والمولدة. يتم تدريبه باستخدام عينات حقيقية من بيانات التدريب والعينات التي تم إنشاؤها من المولد. 
هدف المميز هو تصنيف البيانات الحقيقية بشكل صحيح على أنها حقيقية والبيانات الناتجة على أنها 
مزيفة. 


شبكات الخصومة التوليدية 


تتضمن عملية التدريب لعبة عدائية adversarial game‏ بين المولد والمميز. يهدف المولد إلى إنتاج 
عينات تخدع peel‏ بينما يحاول reall‏ تحسين قدرته على التمييز بين البيانات الحقيقية والمولدة. 


مع تقدم التدريب» يصبح المولد AST‏ مهارةفي إنتاج عينات واقعيةء بينما يصبح المميّز AST‏ مهارةفي 
التمييز بين البيانات الحقيقية والمولدة. ومن الناحية المثاليةء تتقارب هذه العملية إلى نقطة يكون فيها 


المولد قادرًا على توليد عينات le‏ الجودة يصعب على المميّز تمييزها عن البيانات الحقيقية. 


لقد أظهرت شبكات GAN‏ نتائج مبهرةفي مجالات dake‏ مثل تركيب الصور image synthesis‏ 
وإنشاء النص s>s text generation‏ إنشاء الفيديو video generation‏ . لقد تم استخدامها لمهام 
مثل إنشاء صور واقعيةء وإنشاء صور Arye‏ وتحسين الصور منخفضة AB‏ والمزيد. لقد طورت 
شبكات GAN‏ بشكل كبير مجال النمذجة التوليدية وفتحت إمكانيات جديدة للتطبيقات الإبداعيةفي 
الذكاء الاصطناعي. 


*GAN تم تطوير شبكات‎ làLoJ 

يمكن بسهولة خداع خوارزميات التعلم الآلي والشبكات العصبية لإساءة تصنيف الأشياء عن طريق 
إضافة قدر من الضوضاء إلى البيانات. بعد إضافة قدر من الضوضاءء تزداد فرص التصنيف الخاطئ 
للصور. ومن هنا كان الارتفاع الطفيففي إمكانية تنفيذ شيء يمكن للشبكات العصبية أن BAS‏ تصور 
أنماط جديدة مثل عينات بيانات التدريب. وهكذا تم إنشاء شبكات GAN‏ التي تولد نتائج مزيفة 
جديدة مشابهة للنتائج الاصلية. 


تطبيقات شبكات الخصومة التوليدية (GANS)‏ 
إن القراءة عن شبكات GAN‏ أمر مثير AUU‏ وعندما تقرأ تطبيقهاء آمل أن تصل الإثارة إلى ote‏ 
السماء ومن ثم فإن دراسة عمل شبكات GAN‏ تخلق تأثيرًا مختلقَاً على التعلم. 


1. توليد بيانات جديدة من البيانات المتاحة :Generate new data from available data‏ 
ويعني توليد عينات جديدة من عينة متاحة لا تشبه العينة الحقيقية. 

2. إنشاء صور واقعية لأشخاص لم يكونوا موجودين من قبل. 
لا يقتصر GANS‏ على الصورء بل يمكنه إنشاء نصوص ومقالات وأغاني وقصائد وما إلى 
ذلك. 

4. إنشاء موسيقى باستخدام بعض الأصوات المستنسخة Generate Music by using‏ 
:some clone Voice‏ ]13 قدمت بعض TONS‏ فيمكن لشبكات GAN‏ إنشاء ميزة 
استنساخ مماثلة لها.في هذه الورقة البحثيةء اقترح باحثون من معهد SNIT‏ طوكيو نظامًا 
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= 
ol 


ob‏ على توليد ألحان من كلمات SEY‏ بمساعدة العلاقات المكتسبة بين النوتات 
الموسيقية والموضوعات. l‏ 

5. إنشاء النص إلى صورة Object s Object GAN) Text to Image Generation‏ 
(Driven GAN‏ 
إنشاء شخصيات أنمي ني تطوير OW‏ وإنتاج الرسوم المتحركة. 
ترجمة الصور إلى صور Image to Image Translation‏ يمكننا ترجمة صورة إلى أخرى 
دون Lois‏ خلفية الصورة المصدر على مل «lia‏ يمكن Jia! GANS J‏ كلب Abi,‏ 

8. دقة منخفضة إلى دقة :Low resolution to High resolution Wl‏ إذا قمت بتمرير 
صورة أو مقطع فيديو منخفض الدقةء فيمكن ل GAN‏ إنتاج نسخة صورة عالية BUI‏ من 

9. التنبؤ بالإطار التاليفي الفيديو :Prediction of Next Frame in the video‏ من خلال 
تدريب الشبكة العصبية على إطارات صغيرة من الفيديو. تستطيع شبكات GAN‏ إنشاء أو 
التنبؤ بإطار صغير تالي من الفيديو. 

0. إنشاء الصور التفاعلية ‘Interactive Image Generation‏ يعني ذلك أن شيكات GAN‏ 
قادرة على إنشاء صور ولقطات فيديوفي شكل فني إذا تم تدريبها على مجموعة البيانات 
الحقيقية الصحيحة. 

11. الكلام ‘Speech‏ نشر باحثون من كلية لندن مؤخرًا نظامًا يسمى GAN-TTS‏ والذي يتعلم 
كيفية إنشاء صوت خام من خلال التدريب على 567 مجموعة من بيانات الكلام. 


إن الأبحاث حول شبكات GAN‏ تصل إلى ذروتهاء وفي السنوات القادمة سنرى شبكات GAN‏ تنتج 
فيديو وصوت وصورًا عالية الجودة. وكما هو الحال بالفعل» تعاونت Microsoft‏ مع OpenAI‏ 
للعمل على GPT‏ واستكشاف قوة GGAN‏ المستوى التالي. 

مكونات شبكات الخصومة التوليدية (GANS)‏ 

ماهو الحدس الهندسي وراء عمل شبكات *GAN‏ 

المكونان الرئيسيان لشبكات GAN‏ هما المولد Generator‏ والمميز -Discriminator‏ إن دور 
المولد يشبه اللصفي إنشاء عينات مزيفة Fly‏ على العينة الأصلية وجعل التمييز Geol‏ لفهم أنها مزيفة 
على أنها حقيقية. من ناحية أخرى» Zest OB‏ يشبه الشرطة التي يتمثل دورهاني تحديد العيوبفي 
العينات التى أنشأها المولد وتصنيفها على أنها e E‏ المنافسة بين كلا المكونين 
حتى يهم الوصو إن ig o‏ اكنال عي رز dd pal‏ هذا يدل ال شايع Ail cell‏ 
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Components of GAN 


Generator Discriminator 


Training set 


Random M = D= à 
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الآن دعونا نفهم ما هو هذا المكون الثنائي لفهم عملية تدريب GAN‏ بشكل حدسي. 


1( المميز :Discriminator‏ وهو أسلو ب التعلم خاضع للإشراف supervised learning‏ 
approach‏ يعني أنه مصنف بسيط ob Ley‏ البيانات مزيفة أو حقيقية. يتم تدريبه على بيانات 
حقيقية ويقدم تعليقات للمولد. 

2( المولد :Generator‏ وهو اسلوب التعلم غير الخاضع للأشراف unsupervised‏ 
learning approach‏ سيتم إنشاء بيانات مزيفة Fly‏ على البيانات الأصلية (الحقيقية). 
وهي أيضًا شبكة imas‏ تحتوي على طبقات مخفية Ji», hidden layers‏ التنشيط 
activation‏ والخسارة (الخطأ) function‏ 1055. هدفها هو توليد الصورة المزيفة Ely‏ على 
ردود الفعل وجعل المُميز يخدع أنه لا يستطيع التنبؤ بالصورة المزيفة. وعندما يخدع المولد 
المّميّزء يتوقف التدريب ويمكننا القول إنه تم إنشاء نموذج GAN‏ المعمم. 


Condition 


Discriminator Is it correct? 


Generated 
fake samples 


Fine tune training 


Latent random variable 
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هنا يلتقط النموذج التوليدي generative model‏ توزيع البيانات ويتم تدريبه بهذه الطريقة لتوليد 
العينة الجديدة التي تحاول تعظيم احتمالية ارتكاب المُميِّر لخطأ (تعظيم خطأ maximize jel‏ 
«(discriminator loss‏ من ناحية أخرى» يعتمد التمييز على نموذج يقدر احتمالية أن تكون العينة التي 
يتلقاها من بيانات التدريب وليس من المولد ويحاول تصنيفها بدقة وتقليل »3 GAN‏ ومن ثم تم 
صياغة شبكة GAN‏ كلعبة minimax‏ حيث يحاول المميز تقليل مكافأته VID, G)‏ ويحاول المولد 
زيادة خطأ المميز إلى الحد الأقصى. 

ربما تتساءل OYI‏ كيف يتم إنشاء المعمارية الفعلية لشبكة (GAN‏ وكيف يتم بناء شبكتين عصبيتين 
ويتم التدريب والتنبؤ بهما؟ لتبسيط الأمرء قم بإلقاء نظرة على المعمارية العامة ل GAN‏ أدناه. 


Real images Sarglo 


=H 


نحن نعلم أن كلا المكونين عبارة عن شبكات عصبية. يمكننا أن نرى أن خرج المولد متصل مباشرة 
بإدخال المُميّز. والمميز يتنباً به ومن خلال الانتشار الخلفي backpropagation‏ يستقبل المولد إشارة 
تغذية راجعة لتحديث الأوزان وتحسين الأداء. المُميّز عبارة عن شبكة عصبية ذات امامية التغذية feed-‏ 


220| 
JOTUL 


Olcriminıtor 


.forward neural network 


التدريب والتنبقة بشبكات الخصومة التوليدية (GANSs)‏ 
نحن نعرف الحدس الهندسي geometric intuition‏ ل .GAN‏ والآن دعونا نفهم تدريب GAN‏ . 


شبكات الخصومة التوليدية 


الخطوة 1) تحديد المشكلة 

بيان المشكلة هو مفتاح نجاح المشروع لذا فإن الخطوة الأولى هي تحديد مشكلتك. تعمل شبكات 
GAN‏ مع مجموعة مختلفة من المشكلات التي تستهدفهاء لذا تحتاج إلى تحديد ما تقوم بإنشائه مثل 
الصوت والقصيدة والنص والصورة هي نوع من المشاكل. 

الخطوة 2( تحديد معمارية GAN‏ 

هناك العديد من أنواع GAN‏ المختلفةء والتي سندرسها بمزيد من التفصيل. يتعين علينا تحديد نوع 
معمارية GAN‏ التي نستخدمها. 


الخطوة 3( تدريب المميز على مجموعة البيانات الحقيقية 

الآن يتم تدريب المميز على مجموعة بيانات حقيقية. إنه يحتوي فقط على مسار للأمام. ولا يوجد 
انتشار خلفيفي تدريب n Geel‏ من الفترات epochs‏ والبيانات التي تقدمها هي بدون ضوضاء 
وتحتوي Lid‏ على صور oA‏ وبالنسبة للصور المزيفة. يستخدم المميز المثيلات instances‏ التي 
أنشأها المولد كمخرجات سلبية. OW‏ ماذا يحدثفي وقت التدريب على التمييز. 


ويصنف كلا من البيانات الحقيقية والمزيفة. 

يساعد خطأ المميز discriminator loss‏ على تحسين أدائها ومعاقبتها عندما تصنف بشكل خاطئ 
على أنها حقيقية أو مزيفة أو العكس. 

يتم تحديث أوزان المُميز من خلال خطأ المُميز. 


الخطوة 4( تدريب المولدات 

قم بتوفير بعض المدخلات المزيفة للمولد (الضوضاء) وسيستخدم بعض الضوضاء العشوائية 
random noise‏ ويولد بعض المخرجات المزيفة. عندما يتم تدريب المولد» يكون المميز ME‏ 
وعندما يتم تدريب المميزء يكون المولد SLE‏ أثناء تدريب المولد على أي ضوضاء عشوائية كمدخل؛ 
فإنه يحاول تحويله إلى بيانات ذات معنى. يستغرق الحصول على مخرجات ذات معنى من المولد وقتا 
ويستمرفي العديد من العصور. خطوات تدريب المولد مذكورة أدناه. 


e‏ الحصول على ضوضاء عشوائية وإنتاج مخرجات المولد على عينة الضوضاء. 
ع توقع إخراج المولد من التمييز على أنه أصلي أو مزيف. 

0 نحسب ks‏ المميز. 

gradients إجراء الانتشار الخلفى من خلال المميز والمولد لحساب التدرجات‎ e 
أوزان المولد.‎ idee استخدم التدرجات‎ ٠ 
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الخطوة 5( تدريب المميز على البيانات المزيفة 
سيتم تمرير العينات التي تم إنشاؤها بواسطة المولد إلى المميز وسوف يتنبا Ob‏ البيانات التي تم تمريرها 
إليها مزيفة أو حقيقية وستقدم تعليقات إلى المولد مرة أخرى. 


الخطوة 6) تدريب المولد بمخرجات المميز 
مرة أخرى» سيتم تدريب المولد على التعليقات المقدمة من المميز ومحاولة تحسين الأداء. 


هذه عملية متكررة وتستمرفي العمل حتى لا ينجح المولدني خداع المميز. 
Training of GAN‏ 
0 © © © © © 


Define Select Train Generate Train Train 


á Architecture Discriminator a Discriminator Generator 
jm OFGAN  OnReal inputsfor onFake و‎ 
Problem Data Generator Data Discriminator 


(GANS) خطأ شبكات الخصومة التوليدية‎ dJla 
loss والآن دعونا نفهم دالة الخسارة (الخطأ)‎ GLS مفهومًا‎ GAN آمل أن يكون عمل شبكة‎ 
التي تستخدمها وتقليلها وتعظيمهاني هذه العملية التكرارية. يحاول المولد تقليل دالة الخطأ‎ function 
إذا كنت قد لعبت من قبل.‎ Minimax تعظيمها. إنها نفس لعبة‎ al التالية بينما يحاول‎ 

min max V(D,G) 


V(D, G) = E, praca (a) log D(a)] F Eip (z) [log(1 = D(G(2))] 


D(x) e‏ هو تقدير المميّر لاحتمال أن يكون مثيل البيانات الحقيقى × حقيقيًا. 

l هي القيمة المتوقعة على كافة مثيلات البيانات الحقيقية.‎ Ex e 

.2 هو خرج المولد عند إعطاء الضوضاء‎ G(z) e 

D(G(2) ٠‏ تقدير !2.25 لاحتمال أن يكون المثيل المزيف حقيقيًا. 

Ez e‏ هي القيمة المتوقعة على جميع المدخلات العشوائية للمولد (في الواقع» القيمة المتوقعة 
على جميع المثيلات المزيفة التي تم إنشاؤها (GG)‏ 
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.cross- entropy الصيغة مشتقة من الانتروبيا المتقاطعة‎ e 


التحديات التي تواجهها شبكات الخصومة التوليدية (GANS)‏ 

1( مشكلة الثبات بين المولد والمميز: لا نريد أن يكون هذا المميز صارمًا ALU‏ بل نريد 
أن يكون متساهلا. 

2( مشكلة في تحديد موضع الكائنات: لنفترض أن لديناني الصورة 3 أحصنة وأن المولد قد 
أنشأ 6 عيون وحصانًا Moly‏ 

3( المشكلة في فهم الأشياء العالمية: لا تفهم شبكات GAN‏ المعمارية العالمية أو 
المعمارية الشاملة التي تشبه مشكلة المنظور. وهذا يعني Gal‏ بعض الأحيان تقوم GAN‏ 
بإنشاء صورة غير واقعية ولا يمكن أن تكون ممكنة. 

4( مشكلة في فهم المنظور: لا يمكنه فهم الصور ثلاثية الأبعاد وإذا قمنا بتدريبه على مثل 
هذه الأنواع من الصور فسوف يفشلفي إنشاء صور ثلاثية الأبعاد oY‏ شبكات GAN‏ اليوم 
قادرة على العمل على صور أحادية الأبعاد. 


أنواع مختلفة من شبكات الخصومة التوليدية (GANS)‏ 

:DC GAN (1‏ إنها شبكة GAN‏ تلافيفية (Deep convolutional GAN) dies‏ إنه أحد 
أكثر أنواع معمارية GAN‏ استخدامًا وقوة ونجاحًا. يتم تنفيذه بمساعدة ConvNets‏ بدلاً من 
بيرسيبترون متعدد الطبقات .Multi-layered perceptron‏ تستخدم شبكات ConvNets‏ 
ولا تكون الطبقاتفي هذه الشبكة متصلة بشكل كامل. 

GAN (2‏ المشروطة GAN;‏ غير المشروطة GAN :(CGAN)‏ المشروطة ) Conditional‏ 
(GAN‏ هي شبكة عصبية للتعلم العميق يتم فيها استخدام بعض المعلمات الإضافية. يتم Ga‏ 
وضع التسميات (Labels‏ مدخلات المميز لمساعدة المُميز على تصنيف المدخلات بشكل 
صحيح وعدم امتلاءها بسهولة بواسطة المولد. 

GAN )3‏ للمربع الأصغر :Least Square GAN(LSGAN)‏ هو نوع من GAN‏ يتبنى Jl»‏ 
les‏ المربع الأصغر least-square loss function‏ للمميز. يؤدي تقليل Jl»‏ الهدف ل 
LSGAN‏ إلى تقليل !22 Gl‏ بيرسون -Pearson divergence‏ 

4( المصنف المساعد :Auxilary Classifier GAN(ACGAN) GAN‏ وهو نفس CGAN‏ 
ونسخة متقدمة منه. تنص على أن المميز لا ينبغي أن تصنف الصورة على أنها حقيقية أو مزيفة 
فحسب» بل يجب Cal‏ أن توفر تسمية المصدر أو الفئة لصورة الإدخال. 
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:Dual Video Discriminator GAN - DVD-GAN (5‏ عبارة عن شبكة خصومة توليدية 

لتوليد الفيديو مبنية على معمارية BigGAN‏ يستخدم DVD-GAN‏ مُميزين: المُميز المكاني 
Spatial Discriminator‏ والمميز الزمني Temporal Discriminator‏ . 

:SRGAN (6‏ وظيفته الرئيسية هي تحويل Bul‏ المنخفضة إلى دقة عالية المعروفة باسم تحويل 


.Domain Transformation المجال‎ 


:Cyde GAN (7‏ تم إصدارهني عام 2017 والذي يقوم بمهمة ترجمة الصور Image‏ 
Translation‏ . لنفترض أننا قمنا بتدريبها على مجموعة بيانات صور الخيول ويمكننا ترجمتها 
إلى صور حمار وحشي. 

Info GAN (8‏ إصدار متقدم من GAN‏ قادر على تعلم كيفية فك تشابك التمثيل disentangle‏ 
representation‏ نهج التعلم غير الخاضع للإشراف. 


خطوات تنفيذ GAN‏ الأساسية 
٠‏ استيراد كافة المكتبات. 
ه الحصول على مجموعة البيانات. 
e‏ إعداد البيانات: يتضمن خطوات مختلفة لإنجازها مثل المعالجة المسبقة للبيانات» وتوسيع 
نطاقهاء وتسويتهاء وإعادة تشكيلها. 
o‏ تحديد دالة المولد والمميز. 
o‏ انشاء ضوضاء عشوائية ثم إنشاء صورة بضوضاء عشوائية. 
o‏ إعداد المعلمات مثل تحديد الفترة وحجم الدفعة وحجم العينة. 
e‏ تحديد دالة توليد الصو ركعينات. 
e‏ تدريب المميز بعد ذلك تدريب المولد وسيقوم بإنشاء الصور. 
t‏ سوف نرى مدى وضوح الصور الذي تم إنشاؤه بواسطة المولد. 
التنفيذ العملي (GANS]J‏ على مجموعة بيانات MNIST‏ 
سنتبع OY‏ جميع الخطوات المذكورة أعلاه من خلال تطبيق GAN‏ على مجموعة بيانات شائعة جد 
تعرف باسم مجموعة بيانات .MNIST‏ 
حول مجموعة البيانات 
مجموعة بيانات '1011115:1هي مجموعة بيانات شائعة جد لصور الأرقام المكتوبة بخط اليد بين 0 إلى 


9ني شكل تدرج رمادي بحجم 28*28. ويوجد إجمالي 60000 صورة لهذه الصور المربعة الصغيرةفي 
مجموعة بيانات .MNIST‏ 


شبكات الخصومة التوليدية 


N 
N 


بعض ضوضاء العينة مثل نموذج MNIST‏ إلى المولد لإنشاء نفس المعلومات مثل مجموعة بيانات 
X 1‏ التي تعطي صورًا دقيقة أو أصلية ولكن تم إنشاؤها بالفعل بواسطة نموذج المولد. فلنبداً 


import 
import 
import 
import 
import 


باستيراد المكتبات التى نحتاجها. 


استيراد المكتبات 
تعد مكتبات الاستيراد مفيدة للمعالجة المسبقة والتحويل وإنشاء نموذج الشبكة العصبية. 


numpy as np 
pandas as pd 
matplotlib.pyplot as plt 
os 

tensorflow as tf 


from tensorflow.keras.layers import Input, Dense, LeakyReLU, 
Dropout, BatchNormalization 

from tensorflow.keras.models import Model 

from tensorflow.keras.optimizers import SGD, Adam 


MNIST oü تحميل مجموعة‎ 


عندما نقوم بتحميل مجموعة البيانات المضمنة من أي مكتبة» ففي معظم الأحيان يتم تقسيمها بالفعل 
إلى مجموعة تدريب واختبار train and test set‏ لذلك سنقوم بتحميل مجموعة البيانات إلى 


mnist tf.keras.datasets.mnist 
(Gk traim, y trein), ( test; y test) = muist, load care () 
# Scale the inputs in range of (-1, +1) for better training 


9 train, x tesk = ox trem / 255.0 * 2 — lí, sx ces / 255.0 * 


2 c 
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إذاكنت تريد رسم بعض الأمثلة على الصور من مجموعة البيانات» فيمكنك ببساطة رسمها من مجموعة 
بيانات التدريب باستخدام -matplotlib‏ 


for i in range(49): 
jolie ات ركنت‎ (7,5 Vo auri) 
piles ELS (401 T4) 
#plot raw pixel data 
plt.imshow(x train[i]) 
plt.show() 
تحتوي على 60000 صورة‎ train data قمت بطباعة شكل مجموعة البيانات.» فإن بيانات التدريب‎ 13] 


بحجم 8 وبيانات الاختيار test data‏ تحتوي على 10000 صورة بحجم 28*28. 


تسطيح وتوسيع نطاق البيانات 
نظرًا oY‏ أبعاد مجموعة البيانات هي 3( فسوف نقوم بتسطيحها إلى بعدين و28*28 تعني 684 وسيتم 


.684 460000 تحويلها إلى‎ 
N, H, W = x train.shape #number, height, width 

D=H * W #dimension (28, 28) 

x creim = x crain و‎ 123815856 (=I, D) 

x test = x _ 98818 25815385 (<1, D) 


تعريف نموذج المولد 
نحدد هنا دالة لتطوير شبكة عصبية تلافيفية عميقة .deep convolutional Neural network‏ 
البعد الكامن latent dimension‏ هو متغير يحدد عدد المدخلات إلى النموذج. نعرف طبقة الإدخال 
input layer‏ ثلاث طبقات مخفية Kb hidden layers‏ تسوية الدفعة «Batch normalization‏ 
ودالة التنشيط باسم Leaky RELU‏ وطبقة الإخراج مع دالة التنشيط مثل tanh‏ لأن نطاق بكسل 
الصورة يتراوح بين -1 و+1. 
Defining Generator Model‏ # 
latent dim = 100‏ 


def build generator(latent dim): 
L= Input(shape- (latent. dimy,)) 


x = Dense(256, activation-LeakyReLU (alpha-0.2)) (i) 

x = BatchNormalization (momentum=0.7) (x) 

x = Dense(512, activation=LeakyReLU (alpha-0.2)) (x) 

x = BatchNormalization (momentum=0.7) (x) 

x = Dense(1024, activation=LeakyReLU (alpha-0.2)) (x) 

x — BatchNormalization (momentum-0.7) (x) 

x = Dense(D, activation-'tanh') (x) #because Image pixel 

is between -1 to 1. 
model = Model (i, x) #1 is input x is output layer 


return model 
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لماذا تخد fLeaky RELU‏ 
يساعد Leaky relu‏ على تدفق التدرج Gradient flow‏ بسهولة عبر معمارية الشبكة العصبية. 


RELU فقط القيمة القصوى بين الإدخال والصفر. إذا استخدمنا‎ ReLU تأخذ دالة تنشيط‎ o 
إذا حدث هذا فلن ينتج‎ Dying State فمن المحتمل أن تتعطل الشبكةفي حالة تُعرف باسم‎ 
سوى الصفر لجميع المخرجات.‎ 

o‏ هدفنا هو الحصول على قيمة التدرج من المميز لتشغيل المولدء وإذا تعطلت الشبكة؛ فلن 
يحدث التعلم. 

e‏ يستخدم Leaky ReLU‏ معلمة تعرف باسم alpha‏ للتحكمني القيم السالبة ولا يتم تمرير 
الصفر مطلقا. إذاكان الإدخال Ue ye‏ فسوف يظهر قيمة موجبةء وإذا استقبل LL.‏ فاضربه 
بألفا واسمح لبعض القيمة السالبة بالمرور عبر الشبكة. 


f(z) = maz(a x 2,2) 


لماذاتسوية الدفعات؟ 

له تأثيرني تثبيت عملية التدريب من خلال توحيد عمليات التنشيط من الطبقة السابقة بحيث يكون 
متوسطها صفرًا وتباينها واحداً. لقد أصبح تسوية الدفعات Batch Normalization‏ عنصرًا أساسيًا 
في حين أن تدريب الشبكات التلافيفية العميقة وشبكات GAN‏ لا يختلف عنه. 


أدى تطبيق معيار الدفعة batch norm‏ مباشرة على جميع الطبقات إلى تذبذب العينة وعدم استقرار 
النموذج. 

تعريف نموذج المميز 

نحن هنا نطور شبكة imas‏ امامية التغذية Feed Forward Neural network‏ بسيطة للمميز حيث 
سنمرر حجم الصورة. دالة التنشيط المستخدمة هي leaky ReLU‏ وأنت تعرف السبب وراء ذلك ويتم 
استخدام isigmoid‏ طبقة الإخراج لمشكلات التصنيف الثنائي لتصنيف الصور على أنها حقيقية أو 


مزيفة. 
Clisealimalimercoi (3b ey S126) s‏ امال مارفا Cer‏ 

i = mE lshapes= ار 1م د‎ ) 

x = Dense(512, activation=LeakyReLU (alpha-0.2)) (i) 

x = Dense(256, activation=LeakyReLU (alpha-0.2)) (x) 

x = Dense(1, activation-'sigmoid') (x) 

model - Model(i, x) 

return model 

تجميع النماذج 


حان الوقت الآن لتجميع compile‏ المكونات المحددة لشبكات GAN‏ 
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# Build and compile the discriminator 
discriminator = build_discriminator (D) 
discriminator.compile ( loss='binary crossentropy', 
optimizer-Adam(0.0002, 0.5), metrics=['accuracy'"]) 
# Build and compile the combined model 

generator = build generator(latent dim) 


سنقوم OYI‏ بإنشاء مدخلات لتمثيل عينات الضوضاء من الفضاء الكامن latent space‏ ونمرر هذه 
الضوضاء إلى المولد لتوليد الصورة. بعد ذلك نقوم بتمرير الصورة المولدة إلى المميز ونتوقع أنها مزيفة 
ol‏ حقيقية.في المرحلة الأوليةء لا نريد أن يتم تدريب المُّميز وتكون الصورة مزيفة. 


## Create an input to represent noise sample from latent 
Space 

4 = OU (shapes (latent chimny )) 

## Pass noise through a generator to get an Image 

img = generator (z) 

discriminator.trainable = False 

fake pred = discriminator (img) 


إنشاء نموذج المولد 
تساعد المولد على تحسين أدائه. 


combined model gen = Model(z, fake pred) #first is noise 
and 2nd is fake prediction 

# Compile the combined model 

combined model gen.compile(loss-'binary crossentropy', 
optimizer-Adam(0.0002, 0.5)) 


تعريف معلمات تدريب GAN‏ 
حدد الفترات epochs‏ وحجم الدفعة batch size‏ وفترة العينة sample period‏ مما يعني أنه بعد 
ote‏ الخطوات التي سيقوم المولد بإنشاء العينة. بعد AUS‏ نحدد تسميات الدفعة Batch labels‏ على 
أنها واحد وصفر. واحد يمثل أن الصورة حقيقية والصفر يمثل أن الصورة مزيفة. وقمنا Card‏ بإنشاء 
قائمتين فارغتين لتخزين اخطاء المولد والمميز. والأهم من ذلك أننا نقوم بإنشاء ملف فارغني دليل 
العمل حيث سيتم حفظ الصورة التي تم إنشاؤها من خلال المولد. 

batch size - 2 


epochs - 12000 
sample period - 200 


ones = np.ones(batch size) 

Zeros. = No. ZOOS (baren S128) 

#store generator and discriminator loss in each step or each 
epoch 


el losses = [i 


شبك الخصومة التوليدية 


ej losses = [| 
#create a file in which generator will create and save 
images 
Lif MOG OS Parch ez SES (Geum tneagest) E 
os.makedirs('gan images") 


دالة لإنشاء نماذج الصور 

قم بإنشاء دالة تقوم بإنشاء شبكة من العينات العشوائية من المولد وحفظهاني ملف. بكلمات بسيطة 
سيتم إنشاء صور عشوائيةفي بعض الفترات. نحدد حجم الصف ب 5 والعمود أيضًا ب 5( لذلكفي تكرار 
واحد أو على صفحة واحدة سيتم إنشاء 25 صورة. 


def sample images (epoch): 


LOWS, Coles = S 5 

norse = np.random.randn(rows ^ cols, latent dim) 
imgs = generator.predict (noise) 

f Rescale images 0 - 1 


imgs = (0.5 ~ Imge + 05 
IE, axs = ple Silojolloics (ewe Cols) pig co olog Gue enel 
axis to store 
idx = 0 
for i in range (rows): #5*5 loop means on page 25 5 
will be there 
for j in range(cols): 
axs[i,j].imshow(imgs[idx].reshape(H, W), cmap='gray') 
eus [Lab J) ll ELE (OEE V) 


idx += 1 
fig.savefig("gan images/%d.png" 5 epoch) 
plt.close() 


تدريب المميز ثم المولد لإنشاء الصور 


بالإضافة إلى بعض الصور المزيفة إلى المميز لتدريبها Dae‏ حتى تكون قادرة على تصنيف الصور. بعد 
ذلك» نقوم بإنشاء شبكة ضوضاء عشوائية مثل الصورة الحقيقية ونمررها إلى المولد لإنشاء صورة 
جديدة. بعد ذلك نقوم بحساب خطأ كلا النموذجين وفي الصورة التي تم إنشاؤهاء نقوم بتمرير التسمية 
كواحدة لخداع المميز للاعتقاد والتحقق من أنه قادر على التعرف عليها على أنها مزيفة أم Y‏ 


#FIRST we will train Discriminator(with real imgs and fake 
imgs) 
# Main training loop 
for epoch in range (epochs): 
HEHEHE EH HEH HE EH HH HHH EE EE EE EE EE 
### Train discriminator ### 
HEHEHE EH EH HE HH HHT HHH EE EE EE EE EE 
# Select a random batch of images 
ah = mo CADRES: LENCE, x erein shapely, barch تع ةد‎ 
real imgs = x train[idx] #MNIST dataset 
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# Generate fake images 

noise = np.random.randn(batch size, latent dim) 
#generator to generate fake imgs 

fake imgs - generator.predict (noise) 

# Train the discriminator 

# both loss and accuracy are returned 

C loss real; 0 ace realy = 
discriminator.train on batch(real imgs, ones) #belong to 
positive class(real imgs) 

eL loss mals, cl ace Take = 


discriminator.train on batch(fake imgs, zeros) #fake imgs 
el loss = (0,5 = (cl loss reall az el Joe rake) 
Gece = 0.5 ' (cl acc weal t cl ace take) 


EAE E HH HE HH EH EE 
### Train generator ### 
Ra E HH TE EE E HH E E E E E EE EE 
noise = np.random.randn(batch size, latent dim) 

g loss = combined model gen.train on batch(noise, ones) 
Now we are trying to fool the discriminator that generate 
imgs are real that's why we are providing label as 1 

# do it again! 


noise = np.random.randn(batch size, latent dim) 

g loss = combined model gen.train on batch(noise, ones) 
Save the losses 

d losses.append(d loss) #save the loss at each epoch 


g losses.append(g loss) 
if epoch $ 100 == 
print(f"epoch: ([epoch*l1)/(epochs), d loss: (d loss:.2f], 
GL ACCES {cl 38668 .2 01 g LOSS: qc lossss2:]") 


if epoch $ sample period -- 
sample images (epoch) 


قمنا بتدريبه على 12000 فترة» يمكنك التدرب على المزيد من الفترات. سيستغرق الأمر بعض Ji‏ 3« 
لذا من الأفضل استخدام Kaggle‏ أو Google Colab GPU‏ وسيتم حفظ الصور التي تم إنشاؤها 
بالاسم gan image‏ متبوعًا برقم الفترةفي الدليل المحدد. 


pwj‏ دالة الخطاً 
لقد انتهينا من تدريب GAN‏ ودعونا نرى مدى الدقة التي يستطيع المولد تحقيقهاني جعل المميز 
px‏ 


[obe كه الدزه‎ (ey losses, Jewel e less" ) 
jolie jolie (Cl losses, LASSIE losses") 
plt.legend() 
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—— g losses 
— d losses 


0 2000 4000 6000 8000 10000 12000 


aJl من‎ .. o Wl 
دعونا نرسم الصور التي تم إنشاؤهاني فترات مختلفة لنرى أنه بعد عدد الفترات التي تمكن المولد من‎ 
استخراج بعض المعلومات.‎ 


رسم الصورة التي تم إنشاؤهافي فترة الصفر zero epoch‏ 


from skimage.io import imread 
a = imread('gan images/0.png') 


plt.imshow (a) 
دعونا نرىفي الفترة الأولى ما الذي يؤدي إلى إنشاته.‎ 


0 50 100 150 200 250 300 350 400 
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لا يتم استخراج أي معلومات من المولد ويكون المُميز USS‏ بما يكفي للتعرف عليها على أنها مزيفة. 


رسم الصورة التي تم إنشاؤها بعد التدريب على 1000 فترة 


from skimage.io import imread 
a = imread('gan images/10000.png') 
plt.imshow (a) 


200 


250 
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أصبح OW‏ المولد قادرًا ببطء على استخراج بعض المعلومات التي يمكن ملاحظتها. 


رسم الصورة التي تم إنشاؤها بعد التدريب على 10000 فترة 


0 50 100 150 200 250 300 350 400 


الآن أصبح المولد 538 على البناء لأنه عبارة عن صورة لمجموعة بيانات MNIST‏ وهناك فرص كبيرة 
oy‏ يكون المميز قد تم خداعه. 
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الاستنتاج 

تهانيناء نحن قادرون على تنفيذ وفهم مفهوم وعمل شبكات GAN‏ تعد شبكات Kyte Vis GAN‏ 
في مجال الذكاء الاصطناعي ويمكن أن يصدم الجميع بتطبيقاته ونتائجه. البحثفي هذا المجالفي ذروته 
وهناك المزيد من التطبيقات الجديدةفي هذا المجال على وشك أن تأتي. من الجيد جد أن تمتلك 
المعرفة العملية الأساسية لمثل هذه التقنيات الجديدةفي مجالنا. تتضمن مجالات التطبيقات والبحث 
القادمة ل GAN‏ إنشاء تصميمات داخلية مختلفة وصيغ جزيئية وألوان وما إلى ذلك. GAN‏ هي تقنية 
توفر للآلات الخيال. 


https://www.analyticsvidhya.com/blog/2021/10/an-end-to-end-introduction-to- 


generative-adversarial-networksgans/ 
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Generative GANs شبكات الخصومة التوليدية‎ (1 
Adversarial Networks(GANs) 


SGAN شبكات‎ Galo 
ويمكنها‎ text generator التي تُستخدم أيضًا كمولد نص‎ RNN لقد سمعنا جميعًا عن شبكات‎ 
إنشاء كلمة واحدة أو حرف واحدفي كل مرة. هل يمكن عمل هذا الشيء للصور؟ نعم هناك تقنيات مثل‎ 
HN أعيدت تسميتها‎ il) Fully Visible Belief Networks ISL شبكات الاعتقاد المرئية‎ 
مرة والتي‎ Johs ÍS 3 5 التي‎ (Auto-Regressive Models باسم نماذج التراجع التلقائي‎ 
يمكن أن تؤدي إلى صورة تم إنشاؤها بالكامل (تبدو حقيقية ولكنها ليست كذلك). ولكن هل هناك أي‎ 
هي النماذج‎ GAN طريقة لتوليد الصورة كاملةفي لقطة واحدة؟ الجواب هو نعم مرة أخرى. شبكات‎ 

المستخدمة لإنشاء صورة كاملةفي المرة الواحدة. 


كيف تعمل شبكات 8101 )؟ 

تتكون شبكات GAN‏ من مكونين مختلفينء المولد Generator‏ والمميز d.Discriminator‏ 
شبكات الخصومة التوليدية «Generative Adversarial Networks‏ تعني كلمة Adversarial‏ 
العكس أو بطريقة أخرى يتنافس المولد والمميز مع بعضهما البعض من أجل إنتاج صور واقعية. 


Training set 


Discriminator 


المولد Generator‏ عبارة عن شبكة عصبية تستخدم Jl»‏ قابلة للتفاضل differentiable function‏ 
فهي LE‏ ضوضاء عشوائية كمدخلات وتمرر تلك الضوضاء من خلال الدالة القابلة للتفاضلء 
وتحولها/تعيد تشكيلها لجعلها يمكن التعرف عليها. يحاول إنتاج صور حقيقية تعتمد mad ule US‏ 
الإدخال input noises‏ لكن السؤال هو كيف ينتج هذا المولد الصورة الصحيحة؟ يجب تدريبه ولا 
حتى يتمكن من إنتاج صور واقعية؛ أليس كذلك؟ 
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تختلف عملية تدريب شبكات GAN‏ عن تلك الخاصة بشبكات (CNN‏ حيث نقوم بتدريب النموذج 
على صور متعددة ar‏ إلى جنب مع UES‏ الإخراج الخاصة بهاءني شبكات GAN‏ لا يوجد مخرجات 
مرتبطة بكل صورة إدخال. نعرض فقط على النموذج مجموعة من الصور ونطلب من النموذج إنتاج 
بعض الصور الجديدة التي تأتي من نفس التوزيع الاحتمالي. 

لذلك نقوم بتمرير ضوضاء عشوائية random noises‏ من خلال شبكة المولدات التي تنتج الصور 
الناتجة عن طريق تحديد الميزات من مجموعة الإدخال. هناك شبكة أخرى تستخدمها شبكات GAN‏ 
تسمى المميز Discriminator‏ والتي توجه المولد إذا كانت الصورة المنتجة حقيقية أم لا. المميز 
عبارة عن شبكة عصبية عادية تقوم فقط بمهمة التصنيف. يتم تدريبه بنصف الصور الحقيقية ونصف 
الصور المزيفة (المولدة) حيث يتم تعيين احتمالية للصور الحقيقية بالقرب من 1 بينما يتم تعيين 
احتمالية للصور المزيفة بالقرب من 0. 

وفي الوقت نفسه. يتم تدريب المولد على العكس GLS‏ فهو يحاول إنشاء الصور حيث يقوم المميز 
بتعيينه إلى ما يقرب من 1. وعلى مدار فترة زمنية» يضطر المولد إلى إنتاج صور ATT‏ واقعية يمكن أن 
تخدع المميز بسهولة. 


SCNN مشابه لشبكات‎ GAN تدريب شبكات‎ Ja 

تحتوي شبكات CNN‏ العادية على بعض دوال الخسارة/التكلفة loss/cost function‏ التي تريد 
تقليلها من أجل تحسين BU‏ لذلك نقوم بتغيير المعلمات التي تؤدي إلى الأوزان المثالية. يشبه تدريب 
شبكات GAN‏ إلى حد ما شبكة CNN‏ ولكن مع بعض التغييرات الرئيسية» لدينا هنا دالتان 
للخسارة/التكلفة مرتبطتان بكل من المولد والمميزء ودوال الخسارة (الخطأ) هذه متعارضة مع بعضها 
البعض. يمكن تفسير عملية التدريب الكاملة لشبكات GAN‏ من خلال دالة القيمة «value function‏ 


حيث يريد المولد تقليل دالة القيمة الخاصة به. ويريد المميز تعظيم دالة القيمة الخاصة به. 


يمكننا بسهولة فهم دالة القيمة باستخدام ikä‏ السرج -Saddle Point‏ 
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Generator Value Discriminator Value 


a Function Function ور‎ 


عندما ترى دالة قيمة المولد Generator Value Function‏ نصل إلى النقطة المثالية من خلال 
الذهاب إلى الحد الأدنى من السرج بينما بالنسبة إلى المميز نحقق نفس الشيء من خلال الذهاب إلى 
أعلى (الذروة القصوى o (maximum peak‏ السرج العكسي. وهذا ما يفسر أنه بالنسبة لتدريب 
شبكات GAN‏ نحتاج إلى تقنيتين للتحسين لكل من المولد Goodly‏ اللتين ستعملانفي وقت واحد. 
لا توجد طبقة التفافية Convolution‏ أو متكررة Recurrent‏ مستخدمة للتدريب» إنها مجرد 
مضاعفة للمصفوفة متبوعة بدوال التنشيط jae)‏ استخدام (sigmoids tanh; leaky relu‏ 
للحصول على تدريب أفضل» يجب أن يكون لدينا طبقة مخفية واحدة على الأقل لكل من المولد 
والمميز. والمُحسّن المفضل لشبكات GAN‏ هو Adam cpus‏ 
تطبيقات شبكات GAN‏ 
يتم استخدام شبكات EGAN‏ عدة WE «oS Ul‏ يتم استخدامها فقط كنشاط ممتع ولكن يمكن رؤية 
استخدام أكثر جديةفي المستقبل. حاليّاك تستخدم شبكات GGAN‏ حالات الاستخدام التالية: 

1. إنشاء شخصيات كرتونية :Generate Cartoon Characters‏ باستخدام شيكات 

«GAN‏ يمكن للمرء إنشاء شخصيات كرتونية بمجرد تمرير أصوات عشوائية» وتبدو تلك 


الشخصيات مثل تلك التي يصنعها ‏ مصمم الرسومات ‏ — 
https://github.com/mnicnc404/CartoonGan-tensorflow‏ 


2. ترجمة الصورة إلى صورة Image to Image Translation‏ استخدام صورة عادية واحدة 
لإنشاء اللوحات الكرتونية/ الفنية أو العكس — https://github.com/phillipi/pix2pix‏ 
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3. شيخوخة الوجه عمنعظ Face‏ هذا شيء ربما رأيته كثيرًا على تطبيقات الوسائط الاجتماعية 
حيث يمكن للمرء que‏ الصور إلى صور x‏ أو Í‏ & - 
https://github.com/ZZUTK/Face-Aging- CAAE‏ 

4. تلوين الصور Image Colourisation‏ باستخدام شبکات «GAN‏ يتم تحويل الصور 
بالأبيض والأسود إلى صور https://github.com/jantic/DeOldify — à gle‏ 

5. الصورة إلى فيديو مباشر Image to Live Video‏ يمكنه تحويل الصور الثابتة إلى مقاطع 
فيديو قصيرة باستخدام بعض التعديلات الخوارزمية. 

6. إنشاء كاثنات ثلاثية الأبعاد GLS :3D object Generation‏ مثل الصور ثنائية الأبعاد 
تستطيع شبكات eU] Cad GAN‏ مقاطع فيديو ثلاثية الأبعاد. 


معظم whe‏ التكنولوجيا (مثل Amazons «Microsofts «Google‏ وما إلى ذلك) يعملون بجد 
على تطبيق شبكات GAN‏ للاستخدام العملى» وبعض حالات الاستخدام هذه هى: 


-Photoshop للجيل التالي من‎ GAN استخدام شبكات‎ Adobe e 

:Google o‏ استخدام شبكات GAN‏ لإنشاء النص. 

IBM œ‏ استخدام شبكات GAN‏ لزيادة البيانات +L) Data Augmentation‏ صور 

تركيبية synthetic images‏ لتدريب نماذج التصنيف الخاصة بها). 

Snap Chat/ TiKTok e‏ لإنشاء فلاتر صور متنوعة (التي ربما تكون قد شاهدتها بالفعل). 

:Disney o‏ استخدام شبكات BAU GAN‏ الفائقة (تحسين جودة الفيديو) لأفلامهم. 
الشىء المميزفي شبكات GAN‏ هو أن هذه الشركات تعتمد عليهافي مستقبلهاء ألا تعتقد ذلك؟ 
إذن ما الذي يمنعك من التعرف على هذه التكنولوجيا الملحمية؟ سأجيب عليه لا شيءء أنت فقط 
بحاجة إلى البداية وهذه المقالة ستفعل ذلك. دعونا Quo NU‏ الرياضيات وراء المولد والمميز. 
الغرض الوحيد من المميز هو تصنيف الصور الحقيقية والمزيفة. للتصنيف» يتم استخدام الشبكة 
العصبية التلافيفية التقليدية Convolutional Neural Network (CNN)‏ مع دالة تكلفة cost‏ 
محددة. تعمل عملية التدريب الخاصة بالمميز على النحو التالي: 


Uo 
ol 
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Output (y) 


ta 


Discriminator 


حيث أن X‏ ولا هما ميزات الإدخال input features‏ والتسميات labels‏ على التوالي» يتم تمثيل 
الإخراج باستخدام )9( ويتم تمثيل معلمات الشبكة بواسطة )8( 

تحتاج GAN cU‏ التدريبية إلى مجموعة من صور التدريب والتسميات الخاصة de‏ وتنتقل هذه 
الصور كميزة إدخال إلى CNN‏ مع وجود مجموعة من المعلمات التي تمت تهيئتها. تقوم شبكة 
CNN‏ هذه بإنشاء مخرجات عن طريق ضرب مصفوفة الوزن OW)‏ مع ميزات الإدخال CX)‏ وإضافة 
انحياز (B)‏ فيها وتحويلها إلى مصفوفة غير خطية عن طريق تمريرها إلى دالة التنشيط activation.‏ 
.function‏ 

ويشار إلى هذا الإخراج على أنه مخرجات predicted output 45 ga‏ ثم يتم حساب الخطأ ly‏ على 
معلمات الأوزان التي يتم ضبطهاني الشبكة من أجل تقليل الخطأ. 


الوظيفة الرياضية للمولد 
هدف المولد هو إنشاء صورة مزيفة من التوزيع المحدد (مجموعة الصور). وهو يفعل ذلك من خلال 
الإجراء التالي: 


Features (X) 


Generator Discriminator 
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يتم تمرير مجموعة من متجهات الإدخال input vectors‏ (ضوضاء عشوائية (random noise‏ عبر 
الشبكة العصبية للمولد والتي تقوم بإنشاء صورة جديدة GLS‏ عن طريق ضرب مصفوفة وزن المولد مع 


تعمل هذه الصورة التي تم إنشاؤها كمدخل للمميز الذي تم تدريبه لتصنيف الصور المزيفة والحقيقية. 
ثم يتم حساب الخطأ للصور التي تم إنشاؤهاء وعلى أساسها يتم تحديث المعلمات للمولد حتى نحصل 
على دقة جيدة. 

بمجرد أن نكون راضين عن دقة المولدء نقوم بحفظ أوزان المولد وإزالة المميز من الشبكةء واستخدام 
مصفوفة الوزن تلك لتوليد المزيد من الصور الجديدة عن طريق تمرير مصفوفة ضوضاء عشوائية 
vx‏ مختلفةفي كل مرة. 

GAN المتقاطعة الثنائية لشبكات‎ Lug JU JI Le à 

من أجل تحسين معلمات شبكات «GAN‏ نحتاج إلى دالة خطأ تخبر الشبكة بمدى حاجتها للتحسين 
من خلال حساب الفرق بين القيمة الفعلية actual‏ والمتوقعة .predicted‏ تسمى دالة الخطأ 
المستخدمةفي شبكات GAN‏ باسم الانتروبيا المتقاطعة الثنائية Binary Cross-Entropy‏ ويتم 
تمثيلها على النحو التالي: 


m 


1 5 
4 — m 7] h( —y of] = 27,0 
2 og h(z(?,8) + (1 — y(?) log(1 — h(x, 0))] 


ميزة الإدخال. وتمثل O‏ المعلمة. 
دعونا نقسم دالة التكلفة هذه إلى أجزاء فرعية من أجل الحصول على فهم أفضل. الصيغة المعطاة هي 
مزيج من حدين حيث يتم استخدام أحدهما عندما يكون فعالاً عندما تكون التسمية "0" والآخر مهم 
عندما تكون التسمية "1". الحد الأول هو: 

y log h(a, 0)‏ 
إذا كانت القيمة الفعلية هى "1" والقيمة المتوقعة هى "0-"في هذه الحالةء نظرًا log(~0) oY‏ يميل إلى 
اللانهاية السالبة أو مرتفع جداء وإذا كانت القيمة المتوقعة log(~1) ob "-1" Cai‏ سيكون BB‏ من 
"0" أو أقل Le‏ لذلك يساعد هذا الحدفي حساب الخطأ لقيم التسمية "1". 


)1 - y?) log(1 — h(a , 0)) 
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إذا كانت القيمة الفعلية هي "0" والقيمة المتوقعة هي "1~" فإن log(1- C1)‏ سيؤدي إلى لانهاية 
سالبة أو عالية dau‏ وإذاكانت القيمة المتوقعة هي "~O"‏ فإن المصطلح سيكون تنتج نتائج "~O"‏ أو خطأ 
أقل جداء لذلك يتم استخدام هذا الحد لقيم التسمية الفعلية "0". 


سيعيد أي من حدي الخطأ القيم السالبةفي حالة خطأ التنبق ويشار إلى مجموعة هذه الحدود باسم 
-Entropy (Log Loss)‏ ولكن بما أنها سلبيةء لجعلها أكبر من "1" فإننا نطبق de‏ إشارة سالبة 
(يمكنك أن ترىفي الصيغة الرئيسية)» وتطبيق هذه الإشارة السلبية هو ما يجعلها إنتروبيا متقاطعة 
Cross- Entropy (Negative Log Loss)‏ . 


تدريب GAN eàg.oJ‏ الأول 
سنقوم بإنشاء نموذج GAN‏ يكون Hold‏ على إنشاء أرقام مكتوبة بخط اليد من توزيع بيانات MNIST‏ 


Py Torch باستخدام وحدة‎ 


Vl‏ لنستورد الوحدات المطلوبة: 


$matplotlib inline 

import numpy as np 

E COren‏ عدت هك 

import matplotlib.pyplot as plt 


datasets نفسها والتي تسمى‎ Py Torch البيانات من الوحدة الفرعية التي توفرها‎ b e 


# number of subprocesses to use for data loading 
num workers = 0 

# how many samples per batch to load 

bacch eize = G4 

# convert data to torch.FloatTensor 

transform = transforms.ToTensor() 

f get the training datasets 

EEA Carce = datasets MNIST(r00r= data teas US, 
download-True, 
transform-transform) 

# prepare data loader 

train loader = torch.utils.data.DataLoader (train data, 
barch size=barcchn S1 Z28, 


num workers-num workers) 
تصور البيانات‎ 
الذي يستخدم الموترات» فسنقوم بتحويل‎ Py Torch سنقوم بإنشاء نموذجنا على إطار عمل‎ UM نظرًا‎ 
إذا كنت تريد تصور البيانات» يمكنك المضي قدمًا واستخدام مجموعة‎ torch tensors بياناتنا إلى‎ 
التعليمات البرمجية التالية:‎ 


# obtain one batch of training images 
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dataiter 


images, 


images - 


= iter (train loader) 


labels = dataiter.next() 


images .numpy () 


# get one image from the batch 
img = np.squeeze(images[0]) 

bake; = jolie 2 123 (ae atro reb vae == (972) 
eos = rig AO suoolor (LLL) 
ax.imshow(img, cmap='gray') 


«matplotlib.image.AxesImage at 0xl0bab29e8> 
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المميز 


ol‏ الوقت الآن لتعريف شبكة المميز وهي عبارة عن مزيج من طبقات CNN‏ المختلفة. 


import torch.nn as nn 
Importe COCA MÎ 2 عات‎ n ase s 1 
class Discriminator (nn.Module): 


def 


def 


Bene (Seli, input size, nicken (lbi مناه عجارم‎ eize) s 


Sloe (Diser 1 52022 (عدت‎ Selta mit  (() 

# define hidden linear layers 

Selir rel = ma, IRE (AOE Size; سن كك لا‎ Chima) 
Selir 1e = Mol ASAE (ICES CFA, MICE ckm- z) 
Gelt EES = mmo 11-312 ) 226 Chim 2, micellen CIM) 
final fully-connected layer 

SELE weal = mim, meci (lalackolein Chin, OUEOUE Size) 
dropout layer 

self.dropout = nn.Dropout(0.3) 

forward(self, x): 

flatten image 

x = x.view(-1, 28*28) 

all hidden layers 

x = Po leaky sesh (Selle CEL (x), 052) s; (muit; 


negativ 


slope=0.2) 

= self.dropout (x) 

= Pa lleeiley seeilul (sellic 5152 (6), 052) 
Self.dropout (x) 


x x xl 
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x = Poleaky relulselri FES CN; 0542) 
x = self.dropout (x) 

# final layer 

out = self.fc4(x) 

return out 


يتبع SUI‏ 2 أعلاه معمارية Python‏ التقليدية القائمة على الكائنات. fel‏ 2ء۴ fc3 (fc3‏ هي الطبقات 
المتصلة بالكامل .fully connected layers‏ عندما نمرر ميزات الإدخال input features‏ الخاصة 
بناء فإنها تمر عبر كل هذه الطبقات بدءًا من fel‏ وفي النهايةء UJ‏ طبقة واحدة dropout layer‏ 
تستخدم لمعالجة مشكلة الضبط الزائد overfitting‏ 


في نفس الكود. ستشاهد دالة باسم «Forward (self, x)‏ هذه الدالة هي تنفيذ af‏ الانتشار الأمامي 
forward propagation‏ الفعلية حيث تتبع كل طبقة .fc2 fcl)‏ 3ءء Ul» (fc4s‏ التنشيط 
(leaky relu)‏ لتحويل المخرجات الخطية إلى غير خطية 


المولد 
بعد ذلك سوف نتحقق من مقطع المولدفي :GAN‏ 


class Generator (nn.Module) : 

cer _ init (selt, Impor size, Mem Chim, output size) 8 
Super (Cenerator, Seli) o imie  () 
# define hidden linear layers 
seli rel = MM. bhinear (input Calas, MIAMI chimi) 
gelT rEZ = nim. Eme (micen Chim, Ridden Chiz) 
Gebr 1e) = mn. bhinear ) 15116151 (n^, MICE clima) 
# final fully-connected layer 
SELE Ca = شم‎ bone لمات ها)‎ Am 4, Gurone Size) 
# dropout layer 
SELE ,Chaojxouwlic = mmi- مه‎ 61 (OS) 

def forward(self, x): 
f all hidden layers 


xs = m leaky celu(selt ECL (x), 052) i (oput, 
negative slope=0.2) 

x = self.dropout (x) 

Poleaky relulselr rez (x), 052)‏ = عد 

x = self.dropout (x) 

m = Po lesky wel (sells. EES; 05.2) 

x = self.dropout (x) 

# final layer with tanh applied 


out = F.tanh(self.fc4 (x) ) 
return out 


تم إنشاء شبكة المولدات أيضًا من الطبقات المتصلة بالكاملء ودوال تنشيط leaky relu‏ والتسرب 
dropout‏ الشيء الوحيد الذي يجعله مختلفًا عن المميز هو أنه يعطى مخرجات اعتمادًا على معلمة 
input size‏ (وهو حجم الصورة المراد إنشاؤها). 
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ضبط المعلمات الفائقة 
المعلمات الفائقة Hyperparameters‏ التي سنستخدمها لتدريب شبكات u^ GAN‏ 


# Discriminator hyperparams 

# Size of input image to discriminator (28*28) 
input size = 784 

# Size of discriminator output (real or fake) 

OL مانام ناه‎ size = 1 

# Size of last hidden layer in the discriminator 
el iniekicn Size = 32 

# Generator hyperparams 

# Size of latent vector to give to generator 

z Sime = 100 

# Size of discriminator output (generated image) 
g Guegouc size = 784 

# Size of first hidden layer in the generator 

G incon size = 32 


إنشاء مثيل eilo WU‏ 
وأخيرًاء ستبدو الشبكة الكاملة كما يلي: 


# instantiate discriminator and generator 

ID > Di Se ERS EOE (none size, Cl micen size, cl output Size) 

G = Generator (4 sive, ir micen sume, g _ OUI size) 

# check that they are as you expect 

ERED) 

E LEK )) 

print (G) 

Discriminator ( 
(fc1): Linear(in_features=784, out_features=128, bias=True) 
(fc2): Linear(in features-128, out features-64, bias-True) 
(fc3): Linear(in features-64, out features-32, bias-True) 
(fc4): Linear(in features-32, out features-1, bias-True) 
(dropout): Dropout(p=0.3) 

) 

Generator ( 


(fcl): Linear(in_features=100, out_features=32, bias=True) 
(fc2): Linear(in features-32, out features-64, bias=True) 
(fc3): Linear(in features-64, out features-128, bias-True) 
(fc4): Linear(in features-128, out features-784, bias-True) 
(dropout): Dropout(p=0.3) 


T 


حساب الاخطاء 

لقد قمنا بتعريف المولد والمميز والآن حان الوقت لتعريف اخطاءهما حتى تتحسن تلك الشبكات 
بمرور الوقت. بالنسبة لشبكات (GAN‏ سيكون لدينا دالة خطأ حقيقي real loss‏ وخطأ مزيف fake‏ 
9 والتي سيتم تعريفها على النحو التالي: 


f Calculate losses 
det real loss (BD out, smooth=False) s 
berch size = D (uh >. S12 (O) 
# label smoothing 
LE 56 OC wh: 
# smooth, real labels = 0.9 
labels = torch ones (batch size) 0-9 
else: 
labels = torch comes (batea size) s; real lees = 1 
# numerically stable loss 
criterion = nn.BCEWithLogitsLoss () 
# calculate loss 
loss = cueste oie (UD. Cle. Scuses4e )( | labele) 
return loss 
Cet rake OSS (D owt) B 
barcch size = D Owr 8126 (0) 
labels = toren, ZEROS (baten etze) | reke labels = 0 
criterion = nn.BCEWithLogitsLoss() 
# calculate loss 
loss = crircerion(D gehe s 56136853 (0) م‎ Labels) 
return loss 


المحسنات 
بمجرد تعريف الاخطاء سنختار optimizer Curve‏ مناسبًا للتدريب: 


Wore TOCA OEM GS OBEN 

# Optimizers 

Je = 0,002 

# Create optimizers for the discriminator and generator 
d optimizer = optim.Adam(D.parameters(), lr) 

g optimizer = optim.Adam(G.parameters(), lr) 


cu Jaj‏ النماذج 
نظرًا UM‏ قمنا بتعريف المولد والمميز لكل من الشبكات ودوال الخطأ والمحسنات. فإننا الآن نستخدم 
الفترات epochs‏ والميزات features‏ الأخرى لتدريب الشبكة بأكملها. 


import pickle as pkl 

f training hyperparams 

num epochs - 100 

# keep track of loss and generated, "fake" samples 
samples = [] 

losses - [] 
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print every - 400 

# Get some fixed data for sampling. These are images that 
are held 

# constant throughout training, and allow us to inspect the 
model's performance 

sample size-16 


EEG £4 = MO لهام سرهم‎ UAL OM (EL, il, S28 (sempla Saws, 
2 _ S128) | 
IEE v4 = COLOR. FEO MUNI (EIS z) ic L@eie (0) 
# train the network 
D.train() 
662 alea) 
for epoch in range(num epochs): 
iue bacen i; (real images,  ) am 

enumerate(train loader): 

berch size = real IMAGES 8223 (0) 

## Important rescaling step ## 

ceal imeges = real images2 = 1 s; 238681-35 input 


images from [0,1) to [-1, 1) 
1 
i TRAIN THE DISCRIMINATOR 
1 
d optimizer.zero grad() 

# 1. Train with real images 

# Compute the discriminator losses on real images 
smooth the real labels 

D real - D(real images) 

OL zeal loss = zeal loss (D real; Suena eie) 

2. Train with fake images 

# Generate fake images 

# gradients don't have to flow during this step 
with torch.no grad(): 


I 


A= Mo, random imitom- i, gize=(barch 8126; 
2 gue) 

z = OEE. E COM mawy (2) ¢ E LOSE (0) 

fake images - G(z) 


# Compute the discriminator losses on fake images 
D fake = D(fake images) 

d fake loss = fake loss(D fake) 

# add up loss and perform backprop 

cl loss = cl reel loss + ol take Joss 

d loss.backward() 

(Gl optimizer SESS (0) 


TRAIN THE GENERATOR 


Train with fake images and flipped labels 


# 

# 

# 

g optimizer.zero grad() 
# 1 

# Generate fake images 
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(Sl, i, Sze (baten sie),‏ لرصسوت موصن rancon.‏ كنا = ا 
z Size)‏ 

yj = Toren EO UMS (2) 5 16 Loehe (()) 

rakes meges = EZ) 


# Compute the discriminator losses on fake images 
# using flipped labels! 
D fake = D(fake images) 
gq _lloss = zal Joss (D take) i; USS real loss to ilip 
labels 
# perform backprop 
g loss.backward() 
g optimizer.step() 
# Print some loss stats 
Hic barch al % prine eyery == 
# print discriminator and generator loss 
joxesueng ("mexexeim [ (soci ا‎ | e osss (sO.4x]» | 
G lossa (665 Hic}! EOE E ( 
epochil, num iecpochs, d_ OSS. 1tem(), 


g loss.item())) 
## AFTER EACH EPOCH## 
# append discriminator loss and generator loss 
losses.append((d loss.item(), g loss.item())) 
# generate and save sample, fake images 
G.eval() # eval mode for generating samples 
samples z = (Grasse z) 
samples .append (samples_z) 
G.train() # back to train mode 

# Save training generator samples 

Wica Open trein semoles pkt, MO) هت‎ T3 
pkl.dump (samples, f) 


بمجرد تشغيل مجموعة التعليمات البرمجية أعلاه. ستبدأ عملية التدريب على النحو التالي: 


Epoch [ 1/ 100] | d loss: 1.3830 | g loss: 0.6883 
Epoch [ 1/ 100] | d loss: 0.7668 | g loss: 3.1404 
Epoch [ 1/ 100] | d loss: 1.0908 | g loss: 2.6393 
Epoch [ 2/ 100] | d loss: 1.2982 | هو‎ loss: 1.1008 
Epoch [ 2/ 100] | d loss: 1.1753 | g loss: 1.1042 
Epoch [ 2/ 100] | d loss: 1.0874 | g loss: 1.6588 
Epoch [ 3/ 100] | d loss: 0.9747 | g loss: 2.9083 
Epoch [ 3/ 100] | d loss: 1.0724 | g loss: 1.1101 
Epoch [ 3/ 100] | d loss: 1.4727 | g loss: 0.4990 
Epoch [ 4/ 100] | d loss: 1.1590 | g loss: 0.9996 
Epoch [ 4/ 100] | d loss: 1.1832 | g loss: 1.0638 
Epoch [ 4/ 100] | d loss: 1.1652 | هو‎ loss: 1.1463 
Epoch [ 5/ 100] | d loss: 1.2966 | g loss: 1.0950 
Epoch [ 5/ 100] | d loss: 1.3616 | g loss: 1.0312 
Epoch [ 5/ 100] | d loss: 1.2202 | g loss: 1.1301 
Epoch [ 6/ 100] | d loss: 1.1609 | g loss: 1.5148 
Epoch [ 6/ 100] | d loss: 1.1100 | g loss: 1.2183 
Epoch [ 6/ 100] | d loss: 1.2376 | g loss: 1.5296 
Epoch [ 7/ 100] | d loss: 1.2304 | g loss: 1.1526 
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توليد الصور 
del,‏ عندما يتم تدريب النموذج يمكنك استخدام المولد المّدرب لإنتاج الصور المكتوبة بخط اليد 
الجديدة. 


f randomly generated, new latent vectors 
sample size-16 


rane z = mo randon Winakic@ueml(—i, l; eize=(samole م2 1ق‎ 
2 eize) 

rand z = torch.from numpy(rand z).float() 

G.eval() # eval mode 

f generated samples 

rand images - G(rand z) 


# 0 indicates the first set of samples in the passed in list 
# and we only have one batch of samples, here 
view samples(0, [rand images]) 


إن الإخراج الذي تم إنشاؤه باستخدام الكود التالي يريد Éi‏ مثل هذا: 
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dis 
ol 


والآن لديك نموذج GAN‏ المدرب الخاص «tb‏ ويمكنك استخدام هذا النموذج لتدريبه على مجموعة 
مختلفة من الصورء TEY‏ صور جديدة غير مرثية. 
المصدر: 
https://www.analyticsvidhya.com/blog/2021/04/lets-talk-about-gans‏ 


https://www.analyticsvidhya.com/blog/2021/05/%e2%80%8atrain-your-first- 


gan-model-lets-talk-about-gans-part-2%e2%80%8a/ 
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2 شبكات الخصومة التوليدية: بناء نماذجك الأولى 
Generative Adversarial Networks: Build Your First‏ 


Models 

شبکات الخصومة التوليدية Generative adversarial networks (GANS)‏ هي شبكات عصبية 
تولد موادء مثل الصور أو الموسيقى أو الكلام أو النصوص. تشبه ما ينتجه البشر. 

لقد كانت شبكات GAN‏ موضوعًا hts‏ للبحثفي السنوات الأخيرة. ووصف يان ليكون. مدير أبحاث 
الذكاء الاصطناعي ني فيسبوك, التدريب التنافسي ob adversarial training‏ "الفكرة I‏ كثر إثارة 
للاهتمامفي السنوات العشر الماضية"في مجال التعلم الآلي. أدناه. ستتعرف على LAS‏ عمل شبكات 
GAN‏ قبل تنفيذ نموذجين توليديين خاصين بك. 

في هذا البرنامج التعليمي. ستتعلم: 


o‏ ماهو النموذج التوليدي generative model‏ وكيف يختلف عن النموذج التمييزي 
model‏ discriminative؟‏ 

e‏ كيفايتم تنظيم شبكات GAN‏ وتدريبها؟ 

*PyTorch الخاصة بك باستخدام‎ GAN كيفية إنشاء شبكة‎ e 

PyTorchs GPU الخاص بك على التطبيقات العملية باستخدام‎ GAN تدريب‎ RAS e 


هيا بنا Has‏ 


pa Lo‏ شبكات الخصومة التوليدية؟ 
شيكات الخصومة التوليدية هي أنظمة للتعلم الآلي يمكنها تعلم محاكاة توزيع معين للبيانات. تم 
اقتراحها لأول مرةفي ورقة بحثية نشرتها شركة NeurIPS‏ عام 2014 من قبل خبير التعلم العميق إيان 
جودفيلو وزملائه. 
تتكون شبكات GAN‏ من شبكتين عصبيتين» إحداهما مدربة على توليد البيانات والأخرى مدربة على 
التمييز بين البيانات المزيفة fake data‏ والبيانات الحقيقية real data‏ (ومن هنا تأتي الطبيعة "العدائية 
41 للنموذج). على الرغم من أن فكرة إنشاء معمارية لتوليد البيانات ليست جديدة» عندما 
يتعلق الأمر بتوليد الصور والفيديو. فقد قدمت شبكات GAN‏ نتائج مبهرة مثل: 

e‏ نقل Style transfer howl‏ باستخدام «CycleGAN‏ والذي يمكنه إجراء عدد من 

تحويلات النمط المقنعة على الصور. 
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This " كما هو موضحفي موقع الويب‎ StyleGAN توليد الوجوه البشرية باستخدام‎ e 
."Person Does Not Exist 


تعتبر الهياكل التي تولد البيانات. Gly‏ ذلك شبكات GAN‏ النماذج التوليدية generative models‏ 
على عكس النماذج التمييزية discriminative models‏ التي تمت دراستها على Ua‏ أوسع. قبل 
الغوص في شبكات «GAN‏ ستنظر إلى الاختلافات بين هذين النوعين من النماذج. 


النماذج التمييزية مقابل النماذج التوليدية 
إذا كنت قد درست الشبكات العصبية» فمن المحتمل أن معظم التطبيقات التي صادفتك تم تنفيذها 
باستخدام نماذج تمييزية. من ناحية qe ST‏ تعد شبكات الخصومة التوليدية جزءًا من فئة مختلفة من 
النماذج المعروفة باسم النماذج التوليدية. 

النماذج التمييزية هي تلك المستخدمةفي معظم مشكلات التصنيف classification‏ أو الانحدار 
regression‏ الخاضعة للإشراف supervised‏ كمثال على مشكلة التصنيف. لنفترض أنك ترغبفي 
تدريب نموذج لتصنيف صور الأرقام المكتوبة بخط اليد من 0 إلى 9. ولهذا السبب» يمكنك استخدام 
مجموعة بيانات ذات علامات تحتوي على صور للأرقام المكتوبة بخط اليد والتسميات المرتبطة بها 
تشير إلى كل رقم تمثل الصورة. 

أثناء عملية التدريب» يمكنك استخدام خوارزمية لضبط معلمات النموذج. سيكون الهدف هو تقليل 
دالة الخسارة loss function (Lass!)‏ بحيث يتعلم النموذج التوزيع الاحتمالي للمخرجات بالنظر إلى 
المدخلات. بعد مرحلة التدريب. يمكنك استخدام النموذج لتصنيف صورة أرقام جديدة مكتوبة بخط 
اليد من خلال تقدير الرقم الأكثر احتمالاً الذي يتوافق معه اللإدخالء كما هو موضحني الشكل أدناه: 


Training Samples Prediction 
———————— — —-|Discriminative Model 5 
Label:9 Label: 1 Label: 2 Label: 0 
4 / H 0 


Label: 4 Label:2 Label; 9 Label: 3 
g] 2 q 5 Input 
Label: 1 Label: 1 Label: 7 Label: 7 
" /| 7 3 
Label: 6 Label: 6 Label: 6 Label: 0 5 


6| [6] م‎ |o 


يمكنك تصوير النماذج التمييزية لمشاكل التصنيف على أنها كتل تستخدم بيانات التدريب لمعرفة 
الحدود بين الفتات. ثم يستخدمون هذه الحدود x‏ المدخلات والتنبؤق Aguas‏ من الناحية الرياضية. 
تتعلم النماذج التمييزية الاحتمال الشرطي Py | x)‏ للمخرج y‏ بالنظر إلى المدخلات X‏ 


2( شبكات الخصومة التوليدية: «UJ‏ نماذجك الأولى 


إلى جانب الشبكات العصبيةء يمكن استخدام هياكل أخرى كنماذج تمييزية مثل نماذج الانحدار 
اللوجستر logistic regression models‏ وآلات المتجهات الداعمة support vector‏ 
machines (SVMs)‏ 


ومع AUS‏ يتم تدريب النماذج التوليدية مثل شبكات GAN‏ لوصف LAS‏ إنشاء مجموعة البيانات من 
حيث النموذج الاحتمالي. من خلال أخذ العينات من نموذج توليدي» يمكنك إنشاء بيانات جديدة.في 
حين يتم استخدام النماذج التمييزية للتعلم الخاضع للإشراف» OU‏ ما تستخدم النماذج التوليدية مع 
مجموعات البيانات غير المسماة unlabeled datasets‏ ويمكن اعتبارها شكلاً من أشكال التعلم غير 
الخاضع للإشراف -unsupervised learning‏ 

باستخدام مجموعة بيانات الأرقام المكتوبة بخط اليد chandwritten digits‏ يمكنك تدريب نموذج 
توليدي لإنشاء أرقام جديدة. أثناء مرحلة التدريب» يمكنك استخدام بعض الخوارزميات لضبط معلمات 
النموذج لتقليل دالة الخطأ ومعرفة التوزيع الاحتمالي لمجموعة التدريب. وبعد ذلك باستخدام 
النموذج الذي تم تدريبهء يمكنك إنشاء عينات جديدة, كما هو موضحني الشكل التالي: 


Training Samples . Generated Sample 
Generative Model 2321 


0 L| A Ü 
y 2) g 2 Input 
/ /| ? 4 
ae Random Data 
HM me m o 


لإخراج Gye ole‏ عادة ما تأخذ النماذج التوليديةني الاعتبار عنصرًا تصادفياً stochastic‏ أو 
عشوائيًا random‏ يؤثر على العينات التي يولدها النموذج. يتم الحصول على العينات العشوائية 
المستخدمة لقيادة المولد من مساحة كامنة تمثل فيها المتجهات نوعا من الشكل المضغوط للعينات 
المولدة. 

على عكس النماذج التمييزيةء تتعلم النماذج التوليدية احتمالية P)‏ لبيانات الإدخال x‏ ومن خلال 
توزيع بيانات الإإدخال. تكون قادرة على إنشاء مثيلات بيانات جديدة. 

ملاحظة: يمكن أيضًا استخدام النماذج التوليدية مع مجموعات البيانات المسماة labeled datasets‏ 
عندما يتم ذلك يتم تدريبهم على معرفة احتمالية PQx | y)‏ للمدخل x‏ بالنظر إلى المخرج -y‏ ويمكن 
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استخدامها al‏ لمهام التصنيف. ولكن بشكل cele‏ تعمل النماذج التمييزية بشكل أفضل عندما يتعلق 
الأمر بالتصنيف. 


على الرغم من أن شبكات GAN‏ قد حظيت بالكثير من الاهتمامني السنوات a ue MI‏ إلا أنها ليست 
المعمارية الوحيدة التي يمكن استخدامها كنموذج توليدي. إلى جانب شبكات GAN‏ هناك العديد 
من معماريات النماذج التوليدية الأخرى مثل: 

.Boltzmann machines بولتزمان‎ cM e 

. Variational autoencoders شبکكات الترميز التلقائى المتغيرة‎ o 

-Hidden Markov models ماركوف المخفية‎ gòls o 

GPT-2 النماذج التي تتنباً بالكلمة التاليةفي التسلسلء مثل‎ e 
الاهتمام العام الأكبرفي الآونة الأخيرة بسبب النتائج المثيرةفي‎ GAN فقد اجتذبت شبكات‎ AUS ومع‎ 
توليد الصور والفيديو.‎ 
وكيفية تدريبها.‎ GAN ستر ىكيف تعمل شبكات‎ dad gli الآن بعد أن تعرفت على أساسيات النماذج‎ 


معمارية شبكات الخصومة التوليدية 

تتكون الشيكات الخصومة التوليدية من معمارية شاملة مكونة من شبكتين عصبيتين» إحداهما تسمى 
المولد generator‏ وا TS‏ ی تسمى المميز :015611111122601 . 

ويتمثل دور المولدفي تقدير التوزيع الاحتمالي للعينات الحقيقية من أجل توفير العينات المولدة التي 
تشبه البيانات الحقيقية. ويتم تدريب المُميّز بدوره على تقدير احتمالية أن تأتي عينة معينة من البيانات 
الحقيقية بدلاً من أن يقدمها المولد. 

تسمى هذه الهياكل شبكات الخصومة التوليدية generative adversarial networks‏ لأن المولد 
والمميز مدربان على التنافس مع بعضهما البعض: يحاول المولد أن يتحسنفي خداع المميّز بينما 
يحاول المُميّر أن يتحسنفي تحديد العينات المولدة. 

الأبعاد(تر (Mi,‏ مع x‏ الفترة من 0 إلى 920 axo = sinGa)‏ كما هو موضحفي الشكل التالي: 
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كما ترون» تتكون مجموعة البيانات هذه من (x1, X2) BUS‏ تقع فوق منحنى جيبي «sine CUIVE‏ ولها 
توزيع خاص جدا. يظهر الشكل التالي الهيكل العام لشبكة GAN‏ لإنشاء أزواج Gu, X2)‏ تشبه عينات 


Tı 
Real Samples 


j 
Random Data كت‎ G = 
Generated Samples 
LI 


Probability 


N / ۹ 
S i OD * 
0t i iL 
0.25 0 0 2 9 
21 Tı 


يتم تغذية المولد 6 ببيانات عشوائية من الفضاء الكامن latent space‏ ودوره هو AJ‏ بيانات تشبه 
العينات الحقيقية.في هذا Sol‏ لديك مساحة كامنة ثنائية الأبعاد» بحيث يتم تغذية المولد بأزواج 
عشوائية (zi, z2)‏ ويطلب منه تحويلها بحيث تشبه العينات الحقيقية. 

يمكن أن يكون هيكل الشبكة العصبية G‏ تعسفيًاء مما يسمح لك باستخدام الشبكات العصبية كشبكة 


بيرسيبترون متعددة الطبقات «multilayer perceptron (MLP)‏ أو شبكة عصبية تلافيفية 
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«convolutional neural network (CNN)‏ أو أي معمارية أخرى طالما أن أبعاد المدخلات 
والمخرجات تتطابق مع الأبعاد الفضاء الكامن والبيانات الحقيقية. 


يتم تغذية D att‏ إما بعينات حقيقية من مجموعة bly‏ التدريب أو العينات المُولدة المقدمة من 
.G‏ ويتمثل دورهفي تقدير احتمالية انتماء المدخلات إلى مجموعة البيانات الحقيقية. يتم تنفيذ التدريب 
بحيث يكون مخرج (1 هو 1 عندما يتم تغذيته بعينة حقيقية و0 عندما يتم تغذيته بعينة تم إنشاؤها. 


كما هو الحال مع G‏ يمكنك اختيار بنية شبكة عصبية عشوائية ل D‏ طالما نها تحترم أبعاد الإدخال 
والإخراج الضرورية.في هذا المثالء يكون الإدخال ثنائي الأبعاد. بالنسبة للمميز الثنائي» قد يكون الإخراج 
عددًا يتراوح من 0 إلى 1. 

تتكون عملية تدريب GAN‏ من لعبة minimax‏ للاعبين حيث يتم تكييف D‏ لتقليل خطأ التمييز بين 
العينات الحقيقية والمولدة. ويتم AS‏ © لزيادة احتمالية ارتكاب D‏ للخطأ. 


على الرغم من عدم تصنيف مجموعة البيانات التي تحتوي على البيانات الحقيقية» إلا أن عمليات 
التدريب الخاصة ب Gy D‏ يتم تنفيذها بطريقة خاضعة للإشراف.في كل خطوة من التدريب» يتم تحديث 
معلمات Gs D‏ الواقعءفي اقتراح le GAN‏ يتم تحديث معلمات kJ D‏ من المرات. بينما 
يتم تحديث معلمات G‏ مرة واحدة فقط لكل خطوة تدريب. ومع ذلك لجعل التدريب أسهل» يمكنك 
اعتبار k‏ يساوي 1. 


لتدريب CD‏ كل تكرار» يمكنك تسمية بعض العينات الحقيقية المأخوذة من بيانات التدريب بالرقم 
1 وبعض العينات التي تم إنشاؤها المقدمة من G‏ بالرقم 0. وبهذه الطريقةء يمكنك استخدام إطار 
تدريب تقليدي خاضع للإشراف لتحديث معلمات D‏ من أجل تقليل دالة الخطأ. كما هو موضحفي 
المخطط التالى: 


Labels: 1 
£N 


Loss Function 


Probability 


Labels: 0 


N 5 
تم‎ 0 5 
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بالنسبة لكل دفعة من بيانات التدريب التى تحتوي على ole‏ حقيقية byes‏ يمكنك تحديث 
معلمات D‏ لتقليل دالة الخطأ. بعد تحديث معلمات D‏ يمكنك تدريب G‏ لإنتاج عينات تم إنشاؤها 
بشكل أفضل. يتم توصيل مخرج G‏ ب D‏ الذي يتم الاحتفاظ بمعلماته مجمدة. كما هو موضح هنا: 


2 s 1 
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01 


Ly Label=1 


Loss Function 


Generated Samples ا‎ Probability 
Parameters į 


Classification System 


يمكنك أن تتخيل النظام المكون من G‏ و D‏ كنظام تصنيف واحد يستقبل عينات عشوائية كمدخلات 
ويخرج التصنيف. وهو ما يمكن تفسيرهني هذه الحالة على أنه احتمال. 

عندما يقوم G‏ بعمل جيد بما فيه الكفاية لخداع (D‏ يجب أن يكون احتمال الناتج قريبًا من 1. يمكنك 
ail‏ استخدام إطار تدريب تقليدي خاضع للإشراف هنا: سيتم توفير مجموعة البيانات لتدريب نظام 
التصنيف المكون من Dy G‏ من خلال عينات إدخال عشوائيةء وستكون التسمية المرتبطة JS‏ عينة 
إدخال هى 1. 

أثناء التدريب» مع تحديث معلمات (Gs D‏ من المتوقع أن تكون العينات التي تم إنشاؤها المقدمة 
بواسطة G‏ أكثر تشابهًا مع البيانات الحقيقية» وسيواجه D‏ المزيد من المشاكلفي التمييز بين البيانات 
الحقيقية والمولدة. 

الآن بعد أن عرفت كيفية عمل شبكات cob GAN‏ جاهز لتنفيذ شبكتك الخاصة باستخدام 
.Py Torch‏ 


شبكة GAN‏ الأولى لديك 
كتجربة أولى مع شبكات الخصومة التوليدية» ستقوم بتنفيذ المثال الموضحفي القسم السابق. 


ol 
CS 
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لتشغيل المثال» ستستخدم مكتبة ely «PyTorch‏ يمكنك تثبيتها باستخدام توزيع Anaconda‏ 
وحزمة conda‏ ونظام إدارة البيئة. لمعرفة المزيد حول «conda; Anaconda‏ راجع البرنامج 
التعليمي حول إعداد Python‏ للتعلم JYI‏ على Windows‏ 


للبدءء أنشئ بيئة 010 وقم بتنشيطها: 


$ conda create --name gan 
$ conda activate gan 


بعد تنشيط conda ty‏ ستظهر المطالبة باسمهاء .gan‏ ثم يمكنك تثبيت الحزم اللازمة داخل البيئة: 


5 conda install -c pytorch pytorch-1.4.0 
$ conda install matplotlib jupyter 


نظرًا PyTorch oY‏ عبارة عن إطار عمل تم تطويره بشكل نشط للغاية» فقد تتغير واجهة برمجة 
التطبيقات (821)ني الإصدارات الجديدة. للتأكد من تشغيل كود Soll‏ قم بتثبيت الإصدار المحدد 
1.4.0. 


إلى جانب .PyTorch‏ ستستخدم Matplotlib‏ للعمل مع الرسومات البيانية Jupyters‏ 
Notebook‏ لتشغيل التعليمات البرمجيةفي بيئة تفاعلية. القيام بذلك ليس Coll]‏ ولكنه يسهل العمل 
على مشاريع التعلم الآلي. 


لتجديد المعلومات حول العمل مع Jupyter Notebooks; Matplotlib‏ قم بإلقاء نظرة على 
:Jupyter Notebook; (WJI) Python Plotting With Matplotlib‏ مقدمة. 


قبل فتح Jupyter Notebook‏ تحتاج إلى تسجيل conda gan E»‏ حتى تتمكن من إنشاء 
54 باستخدامها كنواة. للقيام بذلك» بعد تفعيل بيئة egan‏ قم بتشغيل الأمر التالي: 

5 python -m ipykernel install --user --name gan 
3555 قم بإنشاء‎ jupyter Notebook عن طريق تشغيل‎ Jupyter Notebook يمكنك الآن فتح‎ 


جديد بالنقر فوق جديد ثم تحديد :gan‏ 
داخل Lut «Notebook‏ باستيراد المكتبات الضرورية: 


import torch 
Erom Corea MOO E ma 


import math 
import matplotlib.pyplot as plt 


cba‏ يمكنك استيراد مكتبة PyTorch‏ باستخدام torch‏ يمكنك أيضًا استيراد nn‏ فقط لتتمكن من 
إعداد الشبكات العصبية بطريقة أقل تفصيلاً. ثم تقوم باستيراد math‏ للحصول على قيمة ثابت Pi‏ 
وتقوم باستيراد أدوات plt S Matplotlib rw‏ كالمعتاد. 
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من الممارسات الجيدة إعداد بذرة مولد عشوائي random generator seed‏ بحيث يمكن تكرار 
التجربة بشكل مماثل على أي جهاز. للقيام بذلكفي Py Torch‏ قم بتشغيل التعليمات البرمجية التالية: 
torch.manual seed(111)‏ 
إعداد بيانات التدريب 
تتكون بيانات التدريب من أزواج Qu, X2))‏ بحيث تتكون X2‏ من قيمة جيب xi‏ ل doa‏ الفترة من 0 
إلى xA‏ يمكنك تنفيذه على النحو التالى: 
erain Carce = CO CN. Zeros (erein cete Lengen; Z2)‏ 
SEAM CAC sg (0) = 2 = math oi 7‏ 


torch.rand(train data length) 
EEN 618831 so L| = cored sim(eraim decals; 0) 


Ergin Lelbeles = OLEN. Zero (nessuna Ceia Lemetin) 

GELA sew = | 

7 (train CEA ll, train MOSSY TOS al am 
range(train data length) 

8] 


هناء تقوم بتكوين مجموعة تدريب مكونة من 1024 Gu, x2) Gaj‏ السطر 2ء قمت بتهيئة 
(Train data‏ وهو موتر بأبعاد 1024 صقا وعمودین» تحتوي جميعها على أصفار. الموتر tensor‏ 
عبارة عن مصفوفة متعددة الأبعاد تشبه مصفوفة .NumbPy‏ 


في السطر 3 يمكنك استخدام العمود الأول من Train data‏ لتخزين القيم العشوائيةفي الفترة من 0 
إلى 2 ثم»ني السطر 4 يمكنك حساب العمود الثاني من الموتر باعتباره جيب العمود الأول. 

بعد ذلك. ستحتاج إلى موتر من التسميات dabels‏ التي يطليها مُحمل .PyTorch ob‏ نظرًا لأن 
شبكات GAN‏ تستخدم تقنيات التعلم غير الخاضعة ISU‏ فيمكن أن تكون التسميات أي شيء. 
لن يتم استخدامها بعد كل شيء. 

في السطر 5 قمت بإنشاء Train labels‏ وهو موتر مليء بالأصفار. US‏ الأسطر من 6 إلى 8ء 
يمكنك إنشاء Train set‏ كقائمة من المجموعات» مع تمثيل كل صف من Train data‏ 
Strain labels;‏ کل صف كما هو متوقع بواسطة أداة تحميل بيانات data loader‏ من .Py Torch‏ 
يمكنك فحص بيانات التدريب من خلال رسم كل نقطة iQ, X2)‏ 


Ol; cein CGlehem[so llo "aw‏ ,5 )|32 ملستت م0 ) جه الدام م ام 


يجب أن يكون الإخراج مشابهًا للشكل التالي: 


شيكات الخصومة التوليدية 
1 


باستخدام Train set‏ يمكنك إنشاء أداة تحميل بيانات :Py Torch‏ 


batch fige = 31 
tren loader = TOTA ttile, dA EA Dale LOA dE E 
ciem Set; bate SIZE DAEEM SIZE, SMUT IE Tae 
) 
بخلط البيانات من‎ est والتي‎ «Train. loader يمكنك إنشاء أداة تحمیل بيانات تسمى‎ La 


Train set‏ وإرجاع دفعات batches‏ مكونة من 32 عينة ستستخدمها لتدريب الشبكات العصبية. 


بعد إعداد بيانات التدريب» تحتاج إلى إنشاء الشبكات العصبية للمميز والمولد الذي سيشكل شبكة 
GAN‏ :ف القسم التالي» عليك تفيل المميز: 

TET 

في «Py Torch‏ يتم تمثيا نماذج الشبكة العصبية بواسطة فتات 5 & من «.nn. Module‏ لذلك سيتعير 


عليك تحديد فتة لإنشاء المميز. لمزيد من المعلومات حول تعريف الفئاتء قم بإلقاء نظرة على البرمجة 
كائنية التوجه .Python 3 @(OOP)‏ 


المميز هو نموذج ذو مدخلات ثنائية الأبعاد ومخرجات أحادية البعد. ستتلقى عينة من البيانات 
الحقيقية أو من المولد وستوفر احتمالية أن تنتمي العينة إلى بيانات التدريب الحقيقية. يوضح الكود 
أدناه كيفية إنشاء المميز: 


class Discriminator (nn.Module): 
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2 det _ imit — (exl) 8 

3 super ()o imit  () 

4 self.model = nn.Sequential( 
5 nn.Linear(2, 256), 
6 
7 
8 


nn.ReLU(), 
E. تهت لظا‎ )0 5.1) n 
nne near (Z56, 122( ) 
9 nn.ReLU(), 
10 TO c DEOCPOUT (0-5 5) 5 
LL miaa 1115592 (LA, (ab E 
12 nn.ReLU(), 
19 MA رت‎ )0 35). 7 
14 Tae binase (OLA, DE 
15 nn.Sigmoid(), 
16 ) 
17) 
18 def forward(self, x): 
19 output = self.model (x) 
20 return output 


يمكنك استخدام init O‏ . لبناء النموذج. Vol‏ تحتاج إلى استدعاء © superO. init‏ 
لتشغيل init O‏ . من xJ.nn.Module‏ التي تستخدمها هي شبكة عصبية MLP‏ محددة 
بطريقة تسلسلية باستخدام .nn.SequentialO‏ لديها الخصائص التالية: 


o‏ السطران 5 و 6: الإدخال ثنائي الأبعاد. وتتكون الطبقة المخفية الأولى من 256 خلية عصبية 
مع تنشيط -ReLU‏ 
e‏ الأسطر8 و9 و11 و12: تتكون الطبقتان المخفية الثانية والثالثة من 128 و64 خلية imas‏ 
على التوالي مع تنشيط ReLU‏ 
o‏ السطران 14 و15: يتكون الناتج من خلية عصبية واحدة ذات تنشيط سيني sigmoidal‏ 
لتمثيل الاحتمال. 
e‏ الأسطر 7 و10 و13: بعد الطبقات المخفية الأولى والثانية ILI‏ يمكنك استخدام التسرب 
dropout‏ لتجنب الضبط الزائد -overfitting‏ 
dL,‏ يمكنك استخدام .forward()‏ لوصف كيفية Cle‏ مخرجات النموذج. هناء تمثل X‏ 
مدخلات النموذج» وهو موتر ثنائي الأبعاد.في هذا التنفيذ. يتم الحصول على الإخراج عن طريق تغذية 
لمدخلات x‏ للنموذج الذي حددته دون أي معالجة أخرى. 
بعد الإعلان عن فئة المميزء يجب عليك إنشاء مثيل لكائن :Discriminator‏ 


discriminator - Discriminator() 
يمثل التمييز مثيلاً للشبكة العصبية التي حددتها وجاهزة للتدريب. ومع ذلك قبل تنفيذ حلقة التدريب»‎ 
إلى مولد. ستقوم بتنفيذ واحدفي القسم التالي.‎ Gad الخاصة بك‎ GAN تحتاج شبكة‎ 


C1 
x] 
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تنفيذ المولد 

في شبكات الخصومة التوليدية GANS‏ المولد هو النموذج الذي JEL‏ عينات من الفضاء الكامن 
كمدخلات له ويولد بيانات تشبه البيانات الموجودةفي مجموعة التدريب.في هذه الحالة هو نموذج ذو 
مدخل ثنائي الأبعاد. والذي سيتلقى نقاط عشوائية (Zi za)‏ ومخرجات ثنائية الأبعاد يجب أن توفر 
BUS Qa cx2)‏ تشبه تلك الموجودةفي بيانات التدريب. 


التنفيذ مشابه لما فعلته بالنسبة للمميز. Al‏ عليك إنشاء فئة Generator‏ ترث من .nn. Module‏ 
وتحديد معمارية الشبكة العصبيةء ثم تحتاج إلى إنشاء كائن :Generator‏ 


class Generator (nn.Module): 

2 det _ init  (self)s 

3 supera imirt () 

4 self.model = nn.Sequential( 
5 nn.Linear(2, 16), 
6 
7 
8 


nn.ReLU(), 
nnmero SA) 
nn.ReLU(), 


9 كا‎ baean (327 2) 
10 ) 
Lal 
IZ def forward(self, x): 
13 output = self.model (x) 
14 return output 
15 


l6generator = Generator() 
16 الشبكة العصبية للمولد. وهي تتألف من طبقتين مخفيتين تحتويان على‎ generator يمثل‎ be 
وطبقة تنشيط خطية تحتوي على خليتين عصبيتينفي‎ ReLU و32 خلية عصبيةء كلاهما مع تنشيط‎ 
الإخراج. بهذه الطريقة سيتكون الإخراج من متجه بعنصرين يمكن أن يكونا أي قيمة تتراوح من‎ 
Qo ao) ستمثل‎ AL اللانهاية السالبة إلى اللانهاية»‎ 
التدريب!‎ elo أنت جاهز‎ golly الآن بعد أن حددت نماذج المُميّز‎ 


تدريب النماذج 
قبل تدريب النماذج» تحتاج إلى إعداد بعض المعلمات لاستخدامها أثناء التدريب: 
Abe = 000‏ 


num_epochs = 300 
loss function = nn.BCELoss () 


هنا قمت بإعداد المعلمات التالية: 


0 يضبط السطر 1 معدل التعلم (dr)‏ الذي ستستخدمه لتكييف أوزان الشبكة. 
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e‏ يحدد السطر 2 عدد الفترات (num epochs)‏ والذي يحدد عدد مرات تكرار التدريب 
بانشخدام مجموعة Cy pull‏ بأكملها الى سي Andes‏ 
٠‏ يقوم السطر 3 بتعيين المتغير loss function‏ إلى دالة الإنتروبيا المتقاطعة الثنائية binary‏ 
«cross—entropy function‏ وهي دالة الخطاً التي ستستخدمها لتدريب النماذج. 
تعد دالة الإنتروبيا المتقاطعة الثنائية بمثابة دالة خطأ مناسبة لتدريب المُميّر لأنها تعتبر مهمة تصنيف 
ثنائية. كما أنها مناسبة لتدريب المولد OY‏ يغذي مخرجاته إلى المميزء والتي توفر مخرجات ثنائية يمكن 
تطبق PyTorch‏ قواعد مختلفة لتحديث الوزن لتدريب النموذجفي .torch.optim‏ ستستخدم 
خوارزمية Adam‏ لتدريب نماذج المميز والمولد. لإنشاء أدوات تحسين الأداء باستخدام 
torch. optim‏ قم بتشغيل الأسطر التالية: 


optimizer discriminator = 
torch.optim.Adam(discriminator.parameters(), lr-lr) 
optimizer generator = 
torch.optim.Adam(generator.parameters(), lr-lr) 


أخيراء تحتاج إلى تنفيذ حلقة تدريب يتم فيها تغذية النماذج بعينات التدريب» ويتم تحديث أوزانها 


لتقليل دالة الخطأ: 


1 for epoch in range (num epochs): 
2 for n, (real samples, _) in enumerate(train loader): 
3 # Data for training the discriminator 
4 real samples labele = tOn. onsas | (oeren Size, iL) ) 
5 latent space samples = torch.randn((batch size, 
2)) 
6 generated samples - 
generator(latent space samples) 
7 generated samples labels = 
[pomo م وصضوت‎ ) (Balen Sze, UW) 
8 all samples = torch.cat((real samples, 
generated samples)) 
9 gli Seimipiles labels = EOE. car 
10 (real samples labels, 
generated samples labels) 
1i ) 
12 
1.3 # Training the discriminator 
14 discriminator.zero grad() 
11 output discriminator = discriminator(all samples) 
16 Joss discriminator = Toss ftunctrion( 
17 output discriminator, all samples labels) 
18 loss discriminator.backward() 


Lg optimizer discriminator.step() 
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20 

21 # Data for training the generator 
22 latent space samples = torch.randn((batch size, 
2)) 

25 

24 # Training the generator 

25 generator.zero grad() 

26 generated samples - 
generator(latent space samples) 

27 output discriminator generated - 
discriminator (generated samples) 

28 losis generator = loss function ( 

29 output discriminator generated, 
real samples labels 

30 ) 

Sab loss generator.backward () 

32 optimizer generator.step() 

38 

34 # Show loss 

55 iit Epoch © 10 == © anc n == barch sive = Lg 
36 prane (E Visjororclag CBOE} LOSS Di 
{loss discriminator}") 

37 print (f"Epoch: {epoch} Loss G.: 


(loss generator]") 


بالنسبة لشبكات GAN‏ يمكنك تحديث معلمات Foal]‏ والمولدفي كل تكرار تدريب. كما هو الحال 
Gl yor‏ جميع الشبكات العصبيةء تتكون عملية التدريب من حلقتين» واحدة لفترات التدريب والأخرى 
للدفعات لكل فترة. داخل الحلقة الداخليةء Glas‏ إعداد البيانات لتدريب المميّز: 


٠‏ السطر2: تحصل على العينات الحقيقية للدفعة الحالية من أداة تحميل البيانات وتعيينها إلى 
.real samples‏ لاحظ أن البعد الأول للموتر يحتوي على عدد من العناصر يساوي 
Batt size‏ هذه هي الطريقة القياسية لتنظيم البياناتفي Py Torch‏ حيث يمثل كل سطر 
ف Sall‏ ع sues‏ من الد 

e‏ السطر4: يمكنك استخدام torch.ones()‏ لإنشاء تسميات بالقيمة 1 للعينات الحقيقية» ثم 
تقوم بتعيين التسميات إلى -real samples labels‏ 

٠‏ السطران 5 و6: يمكنك إنشاء العينات التي تم إنشاؤها عن طريق تخزين البيانات العشوائية 
latent space samples?‏ والتي تقوم بعد ذلك بادخالها للمولد للحصول على العينات 
التي تم إنشاؤها. 

e‏ السطر 7: يمكنك استخدام torch.zeros()‏ لتعيين القيمة 0 للتسميات الخاصة بالعينات 
التي تم إنشاؤهاء ثم تقوم بتخزين التسمياتفي „generator samples labels‏ 

o‏ الأسطر من 8 إلى 11: تقوم بتسلسل العينات والتسميات الحقيقية والمولدة وتخزينهاني 
«all samples labels; all samples‏ والتي ستستخدمها لتدريب المميز. 
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بعد eS‏ السطور من 14 إلى 19 تقوم بتدريب المُميّر: 
e‏ السطر 3:14 «PyTorch‏ من الضروري مسح التدرجاتني كل خطوة تدريب لتجنب 
تراكمها. يمكنك القيام بذلك باستخدام zero gradO‏ 
ه السطر 15: تقوم بحساب مخرجات المميز باستخدام بيانات التدريب الموجودةفي 
.all samples‏ 
e‏ السطران 16 و17: يمكنك حساب 3b‏ الخطأ باستخدام الإخراج من gie‏ 
output. discriminator à‏ والتسمياتفي „all samples labels‏ 
T 118 ani e‏ بحساب التدرجات لتحديث الأوزان باستخدام 
loss discriminator.backward()‏ 
e‏ السطر 0:19 يك تحديثك. ge ead OU‏ طريق استدعاء 
-optimizer discriminator.stepO‏ 
بعد ذلكءني السطر .22( تقوم بإعداد البيانات لتدريب المولد. يمكنك تخزين البيانات العشوائيةفي 
latent space samples‏ مع عدد من الأسطر يساوي -Batch size‏ يمكنك استخدام عمودين نظرًا 
LLY‏ تقدم بيانات ثنائية الأبعاد كمدخلات للمولد. 


تقوم بتدريب المولدفي الأسطر من 25 إلى 32: 

zero grad() السطر 25: يمكنك مسح التدرجات باستخدام‎ ٠ 

e‏ السطر 26: تقوم بتغذية المولد باستخدام ١۲ space samples‏ ه[وتخزين مخرجاتهني 
generated samples‏ 

dele Quid) المولدق. النميز‎ clade تقوم بتغذية.‎ :27 adi e 
والتي ستستخدمها كمخرجات النموذج بأكمله.‎ «discriminator generated wle > 

e‏ الأسطر من 28 إلى 30: يمكنك حساب دالة الخطأ باستخدام مخرجات نظام التصنيف 
المخزنني ^ input discriminator generated‏ والتسميات الموجودةفي 
E «real samples labels‏ تساوي dien:‏ 

3 السطر 31 و 32: تقوم بحساب التدرجات وتحديث أوزان المولد. تذكر أنه عندما قمت 
بتدريب poll‏ أبقيت أوزان المميز مجمدة منذ أن قمت بإنشاء optimizer generator‏ 


مع وسيطه الأو ل الذي يساوي -generator.parameters()‏ 


أخيرًاءفي الأسطر من 35 إلى 37( يمكنك عرض قيم دالة خطأ المميز GU golly‏ نهاية كل عشرة فترات. 


شيكات الخصومة التوليدية 


نظرًا oY‏ النماذج المستخدمةفي هذا المثال تحتوي على معلمات قليلة» فسيتم إكمال التدريب خلال 
دقائق قليلة.في القسم c JEI‏ ستستخدم شبكة GAN‏ المدربة لإنشاء بعض العينات. 


التحقق من العينات التي تم إنشاؤها GAN dhaulgs‏ 

تم تصميم شبكات الخصومة التوليدية لتوليد البيانات. UW‏ بعد الانتهاء من عملية التدريب» يمكنك 
الحصول على بعض العينات العشوائية من الفضاء الكامن وتغذيتها للمولد للحصول على بعض العينات 
المولدة: 


latent space samples = torch.randm(100, 2) 
generated samples - generator(latent space samples) 


ثم يمكنك رسم العينات التي تم إنشاؤها والتحقق مما إذاكانت تشبه بيانات التدريب. قبل رسم بيانات 
«generated samples‏ ستحتاج إلى استخدام))detach.‏ لإرجاع موتر من الرسم البياني الحسابي J‏ 
Py Torch‏ والذي ستستخدمه بعد ذلك لحساب التدرجات: 


generated samples = generated samples.detach() 
plt olor (genereret samplesls;, ol Egeneratecdmsampiiesit 27 y 


nea) 
«UII يجب أن يكون الإخراج مشابهاً للشكل‎ 


1.00 
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يمكنك أن ترى أن توزيع البيانات التي تم إنشاؤها يشبه توزيع البيانات الحقيقية. باستخدام موتر عينات 
الفضاء الكامنة الثابتة وادخاله إلى المولدفي نهاية كل فترة أثناء عملية التدريب» يمكنك تصور تطور 
التدريب: 


After 1 epoch(s) 
1.5 


1.0 


0.0 


x2 


—0.5 
-1.0 


-1.5 


x1 


لاحظ Gal‏ بداية عملية التدريب» يختلف توزيع البيانات الناتجة كثيرًا عن البيانات الحقيقية. ومع ذلك 
مع تقدم التدريب» يتعلم المولد التوزيع الحقيقي للبيانات. 

الآن بعد أن انتهيت من التنفيذ الأول لشبكة الخصومة التوليديةء ستنتقل إلى تطبيق أكثر عملية باستخدام 
الصور. 

مولد أرقام مكتوبة بخط اليد مع GAN‏ 

يمكن لشبكات الخصومة التوليدية Cal‏ إنشاء عينات عالية الأبعاد مثل الصور.في هذا المثال» ستستخدم 
GAN‏ لإنشاء صور للأرقام المكتوبة dao‏ اليد. لتحقيق ذلك ستقوم بتدريب النماذج باستخدام 
مجموعة بيانات MNIST‏ المكونة من أرقام مكتوبة بخط اليد. والتي تم تضمينهاني حزمة 
.torchvision‏ 

للبدء. تحتاج إلى تثبيت (3torchvision‏ بيئة gan conda‏ المنشطة: 


5 conda install -c pytorch torchvision=0.5.0 
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مرة s ol‏ أنت تستخدم إصدارًا محددًا من torchvision‏ لضمان تشغيل كود المثالء SS EG‏ فعلت 
مع -pytorch‏ بعد إعداد البيئةء يمكنك البدءفي تنفيذ النماذجفي Jupyter Notebook‏ افتحه وقم 
بإنشاء Notebook‏ جديد بالنقر فوق جديد ثم تحديد gan‏ 


Us‏ المثال السابقء تبدأ باستيراد المكتبات الضرورية: 


EST orte TOTEN 

EBON COCA ا طوس‎ aud 

import math 

import matplotlib.pyplot as plt 
IMTOO TOW RES SM 


import torchvision.transforms as transforms 
والتحويلات للحصول على‎ torchvision إلى جانب المكتبات التي استوردتها من قبل» ستحتاج إلى‎ 


مرة أخرى. قم بإعداد بذرة المولد العشوائي random generator seed‏ لتتمكن من تكرار التجربة: 

torch.manual seed(111) 
مع عدد‎ cies AST نظرًا لأن هذا المثال يستخدم صورًافي مجموعة التدريب» فيجب أن تكون النماذج‎ 
أكبر من المعلمات. وهذا يجعل عملية التدريب أبطأء وتستغرق حوالي دقيقتين لكل فترة عند التشغيل‎ 
Ale ستحتاج إلى حوالي خمسين فترة للحصول على نتيجة ذات‎ CPU على وحدة المعالجة المركزية‎ 
دقيقة.‎ Sb حوالي‎ aly CPU وبالتالي فإن إجمالي وقت التدريب عند استخدام‎ 


لتقليل وقت التدريب» يمكنك استخدام وحدة معالجة الرسوميات (GPU)‏ لتدريب النموذج إذا كان 
لديك واحدة متاحة. ومع US‏ ستحتاج إلى نقل الموترات والنماذج Code‏ إلى GPU‏ لاستخدامهاني 
عملية التدريب. 

يمكنك التأكد من تشغيل التعليمات البرمجية الخاصة بكفي أي من الإعدادين عن طريق إنشاء كائن 
device‏ يشير إما إلى وحدة المعالجة المركزية (CPU)‏ أو إلى وحدة معالجة الرسومات (GPU)‏ 


إذا كان متاحًا: 
device = ""‏ 
if torch.cuda.is available():‏ 
device = torch.device("cuda")‏ 
else:‏ 
device = torch.device("cpu")‏ 


GY‏ ستستخدم هذا device‏ لتعيين المكان الذي يجب إنشاء الموترات والنماذج cad‏ باستخدام 
وحدة معالجة الرسومات (GPU)‏ )13 كانت متوفرة. 
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الآن بعد أن تم تعيين البيئة الأساسيةء يمكنك إعداد بيانات التدريب. 


إعداد بيانات التدريب 
تتكون مجموعة بيانات MNIST‏ من صور ذات تدرج رمادي مقاس 28 x‏ 28 بكسل لأرقام مكتوبة 
بخط اليد من 0 إلى 9. لاستخدامها مع (Py Torch‏ ستحتاج إلى إجراء بعض التحويلات. لذلك 
يمكنك تعريف «transform‏ وهي دالة سيتم استخدامها عند تحميل البيانات: 
transform = transforms.Compose(‏ 
[transforms.ToTensor(), transforms.Normalize((0.5,),‏ 


(O. NÎ 
) 


تتكون الدالة من جزأين: 
transforms. To TensorO ps .1‏ بتحويل البيانات إلى موتر .Py Torch‏ 
2. تقوم الدالة Transforms.NormalizeO‏ بتحويل (Us‏ معاملات الموتر. 


تتراوح المعاملات الأصلية المقدمة بواسطة transforms. ToTensor()‏ من 0 إلى 1« Gas‏ أن 
خلفيات الصورة سوداء فإن معظم المعاملات تساوي 0 عندما يتم تمثيلها باستخدام هذا النطاق. 


يقوم الدالة Transforms. Normalize()‏ بتغيير نطاق المعاملات من -1 إلى 1 عن طريق طرح 0.5 


من المعاملات الأصلية وتقسيم النتيجة على 0.5. وبهذا التحويل» يتم تقليل عدد العناصر التي تساوي 
ني العينات المدخلة بشكل cues‏ مما يساعدفي تدريب النماذج. 


وسيطات transforms. Normalize)‏ عبارة عن صفین»› (Ma c. Mi)‏ و (51. .... «(Ss‏ حيث 
يمثل n‏ عدد قنوات الصور. تحتوي الصور ذات التدرج الرمادي مثل تلك الموجودةفي مجموعة بيانات 
MNIST‏ على قناة واحدة فقط. وبالتالي فإن المجموعات لها قيمة واحدة فقط. بعد ذلك لكل قناة 1 
من الصورة؛ تقوم الدالة transforms. Normalize()‏ بطرح Mi‏ من المعاملات وتقسيم النتيجة على 

Si 


يمكنك الآن تحميل بيانات التدريب باستخدام torchvision. datasets. MNIST‏ وإجراء 
التحويلات باستخدام :transform‏ 
train set = torchvision.datasets.MNIST(‏ 


root=".", train-True, download-True, transform-transform 


) 

تضمن الوسيطة download- True‏ أنهفي المرة الأولى التي تقوم فيها بتشغيل التعليمات البرمجية 

أعلاه» سيتم تنزيل مجموعة بيانات MNIST‏ وتخزينهاني الدليل الحاليء كما هو موضح بواسطة 
الوسيطة غ+100. 
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الآن بعد أن قمت بإنشاء Train set‏ يمكنك إنشاء أداة تحميل البيانات data loader‏ كما فعلت من 
قبل 


a ع‎ Size = 32 
train loader = torch utils Care Datahoader( 
erain See, AEC size=sbateh fame; iuri ewe 


) 
يمكنك استخدام Matplotlib‏ لرسم Ax‏ عينات بيانات التدريب. لتحسين التصور» يمكنك استخدام 


cmap-gray r‏ لعكس خريطة الألوان ورسم el MI‏ باللون الأسود على خلفية بيضاء: 


real samples, mnist_labells' = next (iter (train Toader)) 
for i in range(16): 

ax = plt.subplot(4, 4, i * 1) 

plt.imshow(real samples[i].reshape(28, 28), 
ema P IEA 189) 


كما ترون هناك أرقام ذات أنماط الكتابة اليدوية المختلفة. عندما تتعلم GAN‏ توزيع bl!‏ فإنها 


الآن بعد أن قمت بإعداد بيانات التدريب» يمكنك تنفيذ نماذج المميز والمولد. 
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تنفيذ المميز والمولد 
في هذه jos! Dbl‏ عبارة عن شبكة عصبية MLP‏ تستقبل صورة بحجم 28 x‏ 28 بكسل وتوفر 
احتمالية أن تنتمى الصورة إلى بيانات التدريب الحقيقية. 


يمكنك تعريف النموذج بالكود التالي: 


1 class Discriminator (nn.Module): 
2 det __ imit — (eel) s 

3 supero imirt — (i 

4 self.model = nn.Sequential( 
5 nn.Linear(784, 1024), 
6 
7 
8 


nn.ReLU(), 
Taal تت‎ (10)... SNI 
rt v oo, 553.2) 
9 nn.ReLU(), 
10 nae تمت ع‎ (0) 5.5) 7 
ial mao نت لل‎ )5 127 256) + 
2 nn.ReLU(), 
13 nne IDheveyexoxbhie: (0) 5.1) p 
14 nn.Linear (25 10, 
LS IMIG! o SL (optaret s 
16 ) 
17 
18 def forward(self, x): 
1g) x = x.view(x.size(0), 784) 
20 output = self.model (x) 
Bab return output 
يمكنك توجيهها بحيث تستقبل الشبكة العصبية‎ MLP لإدخال معاملات الصورةفي الشبكة العصبية‎ 


متجهات ذات 784 معاملا. 


dd‏ التوجيه dvectorization‏ السطر الأول من cforwardO‏ > يؤدي 
استدعاء x-view()‏ إلى تحويل شكل موتر الإدخال.في هذه الحالةء الشكل الأصلي للمدخل x‏ هو 32 
(x 1 x 28 x 8‏ حيث 32 هو حجم الدفعة batch size‏ التي قمت بإعدادها. بعد التحويل» يصبح 
شكل 784 x‏ 32( حيث يمثل كل سطر معاملات صورة مجموعة التدريب. 

لتشغيل نموذج المميز باستخدام وحدة معالجة الرسوميات GRU‏ يجب عليك إنشاء مثيل له وإرساله 
إلى GPU‏ باستخدام ..to()‏ لاستخدام GPU‏ عندما تكون doles‏ يمكنك إرسال النموذج إلى كائن 
device‏ الذي قمت بإنشائه مسبقا: 


discriminator - Discriminator().to(device-device) 
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نظرًا OY‏ المولد سيقوم بإنشاء بيانات أكثر تعقيداء فمن الضروري زيادة أبعاد المدخلات من المساحة 
الكامنة.في هذه LI‏ سيتم تغذية المولد بمدخل ذي 100 بعد وسيوفر مخرجات بمعاملات 784« 
والتي سيتم تنظيمهاني موتر 28 x‏ 28 يمثل صورة. 


إليك كود نموذج المولد الكامل: 


2 class Generator (nn.Module): 

2 ele —  absbbc — (eli) 

3 stoer) MIE () 

4 self.model = nn.Sequential( 
5 

6 

F 

8 


Eme aE (L00 256) 7‏ كا 
nn.ReLU(),‏ 
EAE (ZG, LZ) p‏ كس 
nn.ReLU(),‏ 


9 يا‎ o baee (5127 OZAL 7 
10 nn.ReLU(), 
1i nn.Linear(1024, 784), 
2 ialial دس‎ (Y y 
13 ) 
14 
15 def forward(self, x): 
16 output = self.model (x) 
iy output — output.view(x.srze(0), 1, 28, 29) 
18 return output 
T9 


20generator - Generator().to(device-device) 


في السطر 12 يمكنك استخدام دالة الظل الزائدية Tanh()‏ كتنشيط لطبقة الإخراج حيث يجب أن 

تكون معاملات الإخراجفي الفاصل الزمني من -1 إلى 3.1( السطر 20ء يمكنك إنشاء مثيل للمولد 

وإرساله إلى device‏ لاستخدامه GPU‏ إذا كان متاحًا. 

الآن بعد أن حددت النماذج» ستقوم بتدريبهم باستخدام بيانات التدريب. 

تدريب النماذج 

لتدريب النماذج» تحتاج إلى تحديد معلمات التدريب والمحسنات كما فعلتفي المثال السابق: 
e 0 OOO‏ 


num epochs = 50 
loss function = nn.BCEhoss () 


optimizer discriminator = 
torch.optim.Adam(discriminator.parameters(), lr=lr) 
optimizer generator = 
torch.optim.Adam(generator.parameters(), lr-lr) 
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للحصول على نتيجة أفضل تقوم بتقليل معدل التعلم عن المثال السابق. يمكنك Cad‏ ضبط عدد 


حلقة التدريب مشابهة جدًا لتلك التي استخدمتهاني المثال السابق.في السطور المميزة تقوم بإرسال 
بيانات التدريب إلى الجهاز لاستخدام وحدة معالجة الرسومات (GRU)‏ إذا كانت متوفرة: 


1 for epoch in range(num_epochs) : 
2 for n, (real samples, mnist labels) in 


enumerate (train loader): 


S # Data for training the discriminator 

4 Eel AMG les = al COMICS ECO (SE UES ISIE) 
5 Eeal Samples labelin torci ones (batch size, 
10 

6 device-device 

7 ) 

8 latent space samples! — touch. randi loas ems e 
100) EOC 

9 device-device 
10 ) 
L generated samples - 


generator(latent space samples) 


8 generated samples labels = 

Corci ZEF OS (bach Sze, WD) El 

1 device-device 

14 ) 

1 all samples = torch.cat((real samples, 


generated samples)) 


16 all samples labels’ = torch. cat ( 


17 (real samples labels, 


generated samples labels) 
18 ) 
19 
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20 # Training the discriminator 

2 discriminator.zero grad() 

22 output discriminator - discriminator(all samples) 
2s Toss discriminator — Toss function( 

24 output discriminator, all samples labels 
215 ) 

26 loss discriminator.backward() 

2 optimizer discriminator.step() 

28 

29 # Data for training the generator 

30 latent space samples = er ehem lod لات‎ eI 
TON) ) EOC 

SN device=device 

S ) 

33 

34 # Training the generator 

3) generator.zero grad() 

36 generated samples - 


generator(latent space samples) 

S output discriminator generated - 
discriminator (generated samples) 

38 Toss generator = loss function ( 


38 output discriminator generated, 


real samples labels 


40 ) 

41 loss generator.backward() 
42 optimizer generator.step() 
43 

44 # Show loss 


45 ase dei == barch Size — is 
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46 prine (E EPOCERA: {epoch} Moss) Dy: 


OSS (olalisKohenliulaligvehe(o)s4}) 1) 


47 prine (EVEpoch= {epoch} loss G.: 

{llosis) generator} ™) 

لا يلزم إرسال بعض الموترات إلى وحدة معالجة الرسوميات بشكل صريح مع -device‏ هذا هو الحال 
بالنسبة للعينات التي تم إنشاؤهاني السطر 11ء والتي سيتم إرسالها بالفعل إلى وحدة معالجة الرسومات 
المتاحة حيث تم إرسال generator; latent space samples‏ إلى وحدة معالجة الرسومات مسبقاً. 


oY GE‏ هذا المثال يحتوي على نماذج أكثر تعقيداء فقد يستغرق التدريب وقتا أطول قليلاً. وبعد 
الانتهاء. يمكنك التحقق من النتائج عن طريق إنشاء بعض نماذج الأرقام المكتوبة بخط اليد. 


التحقق من العينات التي تم إنشاؤها بواسطة GAN‏ 
لتوليد أرقام مكتوبة بخط اليد. عليك أخذ بعض العينات العشوائية من الفضاء الكامن وتغذيتها للمولد: 


latent space samples - torch.randn(batch size, 

100).to(device-device) 

generated samples - generator(latent space samples) 

لرسم العينات التي تم إنشاؤهاء تحتاج إلى نقل البيانات مرة أخرى إلى وحدة المعالجة المركزية CPU‏ 

في حالة تشغيلها على وحدة معالجة الرسومات .GPU‏ للقيام Ub‏ يمكنك ببساطة الاتصال ب 

(110ط.. كما فعلت Gle‏ تحتاج Cal‏ إلى استدعاء -detach‏ قبل استخدام Matplotlib‏ لرسم 
البيانات: 


generated samples - generated samples.cpu().detach() 
for i in range(16): 

ax pit subplot A 1 7 1h) 

plt.imshow(generated samples[i].reshape(28, 28), 
cmap =VWg ray. BF) 
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يجب أن تكون المخرجات عبارة عن أرقام تشبه بيانات التدريبء كمافي الشكل التالي: 
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بعد خمسين فترة من التدريب» يتم إنشاء العديد من الأرقام التي تشبه الأرقام الحقيقية. يمكنك تحسين 
النتائج من خلال النظرفي المزيد من فترات التدريب. كما هو الحالفي المثال Goll‏ باستخدام موتر 
ole‏ الفضاء الكامنة الثابتة وتغذيته للمولدفي نهاية كل فترة أثناء عملية التدريب» يمكنك تصور تطور 
التدريب: 


After 1 epoch(s) 


يمكنك أن ترى dal‏ بداية عملية التدريب» تكون الصور التي تم إنشاؤها عشوائية GLS‏ مع تقدم 
التدريب» يتعلم المولد توزيع البيانات الحقيقيةء وفي حوالي عشرين فترةء تشبه بعض الأرقام التي تم 
إنشاؤها البيانات الحقيقية بالفعل. 


2( شبكات الخصومة التوليدية: بناء نماذجك الأولى 


الاستنتاج 
تهانينا! لقد تعلمت كيفية تنفيذ شبكات الخصومة التوليدية الخاصة بك. لقد مررت Y‏ بمثال id‏ 


لفهم معمارية GAN‏ قبل الغوص في تطبيق عملي يقوم بإنشاء صور لأرقام مكتوبة بخط اليد. 

لقد رأيت أنه على الرغم من تعقيد شبكات ob GAIN‏ أطر التعلم الآلي مثل PyTorch‏ تجعل التنفيذ 
Í‏ كثر وضوحًا من خلال تقديم الاشتقاق automatic differentiation AVI‏ وإعداد GPU‏ السهل. 
في هذا البرنامج التعليمي» تعلمت: 


e‏ ماهو الفرق بين النماذج التمييزية والتوليدية. 

e‏ كيف يتم تنظيم وتدريب شبكات الخصومة التوليدية. 

LAS e‏ استخدام أدوات مثل PyTorch‏ ووحدة معالجة الرسومات GPU‏ لتنفيذ نماذج 
GAN‏ وتدرييها. 


تعد شبكات GAN‏ موضوعًا Coo‏ نشطًا GRU‏ حيث تم اقتراح العديد من التطبيقات المثيرةفي 
السنوات الأخيرة. إذا كنت مهتمًا بالموضوع» فتابع الأدبيات التقنية والعلمية للتحقق من أفكار 
التطبيقات الجديدة. 


المصدر: 


https://realpython.com/generative-adversarial-networks/ 
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3( كيفية cl‏ شبكة الخصومة التوليدية GAN‏ في بايثون 
How to build a GAN in Python‏ 


تعرف على كيفية إنشاء شبكة الخصومة التوليدية Generative Adversarial Network (GAN)‏ 
عاملة بسهولةفي لغة Python‏ وذلك باستخدام التعلم الآلي للسماح للذكاء الاصطناعي "بإنشاء" محتوى 
واقعي!. 
المقدمة 
تعد شبكات الخصومة التوليدية (GANS)‏ موضوعًا ساختافي التعلم J‏ لعدة أسباب وجيهة. فيما يلي 
ثلاثة من الأفضل: 
1. يمكن لشبكات GAN‏ تقديم نتائج مذهلةء وإنشاء أشياء جديدة ope)‏ ونصوص. وأصوات» 
وما إلى ذلك) عن طريق تقليد العينات التي تعرضت لها سابقا. 
2 تقدم D E3403 GAN‏ التعلم الآلي — G pe‏ توليديًا -generative model‏ يجمع 
بين التقنيات الموجودة Gona‏ لتقديم أفكار ونتائج حالية وجديدة GLS‏ 
3. إن شبكات GAN‏ هي عبارة عن GUEST‏ حديث )2014( OLY‏ جودفيلو. الباحث السابق 
في «Google‏ والذي أصبح Apple oV‏ (وهو Cal‏ مؤلف مشارك لمرجع قياسي في التعلم 
العميق مع جوشوا بنجيو وآرون كورفيل). 
من المحتمل أن يكون القراء قد واجهوا بالفعل بعض النتائج المثيرة للإعجاب التي تستطيع شبكات 
GAN‏ تحقيقها. خاصةني مجال معالجة الصور. مثل هذه الشبكات قادرة, عند الطلب» على رسم 
صورة لزهرة حمراء أو طائر أسود أو حتى قطة بنفسجية. علاوة على ذلك فإن تلك الزهرة أو الطائر أو 
القطة غير موجودة على الإطلاقفي الواقع» ولكنها بالكامل نتاج "خيال" الشبكة. 


هذه الصور ليست صورًا لاشخاص حقيقيين» فقد تم إنشاؤها بواسطة GAN‏ مدربة بشكل مناسب! 
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كيف يكون هذا ممكناء وهل يمكننا أن نشاركفي المرح؟ تحاول هذه المقالة الإجابة على كلا السؤالينء 
باستخدام كود Python‏ الوظيفي الذي يمكن تشغيله على الكمبيوتر المحمول الخاص بك. قد تحتاج 
إلى إضافة بعض الحزم المفقودة من تثبيت Python‏ الخاص th‏ ولكن هذا هو ما يوجد من أجله 
...Pip‏ 


ماهى شبكة الخصومة التوليدية؟ 
تم تصميم الشبكات Neural networks (NNs) imal‏ كنماذج للتنبؤ والتصنيف. إنها أدوات 
تحسين قوية وغير خطية يمكن تدريبها لتطوير معلماتها الداخلية inner parameters‏ (أوزان الخلايا 
العصبية (neuron weights‏ لتناسب بيانات التدريب. سيمكن هذا NN‏ من التنبؤ وتصنيف البيانات 
نعلم جميعًا مدى الإعجاب الذي يمكن أن تكون عليه تقديرات البيانات التقريبية للشبكات eaa]‏ 
حيث يمكن أن تعنى "البيانات "data‏ أي شىء تقريمًا. ومع ذلك فإن ميزات مثل هذه الخوارزميات 
تشير Gai‏ إلى بعض عيوبهاء مثل: 

o‏ تحتاج الشيكات العصبية إلى بيانات مسماة (مصنفة) ex labelled data‏ تدریبها بشكل 

e‏ والأسوأمن ذلك أنهم بحاجة إلى الكثير من البيانات المصنفة. 

Chad عمومًا ليس لدينا أي فكرة عما تفعله محتويات الخلية العصبية‎ bÍ والأسوأمن ذلك‎ e 

إلافي بعض الحالات الخاصة. 


في جوهرهاء الشبكات العصبية هي خوارزميات خاضعة للإشراف supervised algorithms‏ ومع 
ذلك» فإن بعض متغيراتها تعمل بشكل جيد مع الخوارزميات غير الخاضعة للأشراف unsupervised‏ 
algorithms‏ ويمكن تدريبها على أي نوع من البيانات» دون الحاجة إلى "التسمية "label‏ الذي يتم 
إرفاقه عادة لتمكين الشبكة من التمييز بين الأشياء المعروفة والأشياء غير المعروفة. 

يقدم نموذج GAN‏ إعدادًا آخر مثيرًا للاهتمام غير خاضع للإشراف للشبكات العصبية للعب فيه» ويتم 
وصفه بإيجاز أدناه. 

دعونا نبدأ بالكلمات التى يرمز إليها اختصار :GAN‏ التوليدية generative‏ والعدائية adversarial‏ 
والشيكات ان oN ast‏ هو الأكثر وضوحًا — الشبكات: يتم إنشاء شبكات GAN‏ باستخدام 
شبكات عصبية (عميقة deep‏ عادة). تبدأ شبكة GAN‏ بطبقة إدخال تحتوي على قدر معين من 
الخلايا العصبية المدخلة المتوازية (واحدة لكل رقم يمثله بيانات (JEY‏ وبعض الطبقات المخفية 
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ol 


3( كيفية بناء شبكة الخصومة التوليدية في بايثون 


-gradient-descent backpropagation للتدرج الاشتقاقي‎ 


بعد ذلك نأتي إلى كلمة توليدية والتي تشير إلى هدف هذه الفئة من الخوارزميات. إنهم ينتجون البيانات 
بدلاً من استهلاكها. وبشكل أكثر تحديداء تحتوي البيانات التي تنتجها هذه الخوارزميات على معلومات 
جديدة من نفس "فئة "class‏ البيانات المدخلة المستخدمةفي إنشائها. وعملية التوليد ليست عفويةء بل 
يتم توليد البيانات من بيانات أخرى» عبر آلية سيتم وصفها لاحقا. 

وأخيراء فإ نكلمة "عدائية" - وهي المصطلح الأكثر غموضافي الاختصار - تشرحكيفية حدوث التوليد. 
أي من خلال المنافسة بين خصمين.في حالة GAIN‏ فإن الخصوم هم الشبكات العصبية. 

لذلك Gags‏ الشبكة GAN‏ إلى توليد بيانات جديدة عبر شبكات تم إنشاؤها بشكل متعمد للتنافس مع 
بعضها البعض من أجل تحقيق هذا الهدف. يتم دائمًا تقسيم شبكة GAN‏ إلى مكونين = شبكتين 
عصبيتين (عميقتين Gale‏ الأول يعرف باسم المميز «discriminator‏ ويتم تدريبه على التمييز بين 
مجموعة من البيانات والضوضاء النقية. على سبيل المثال. يمكن أن تتضمن البيانات المدخلة مجموعة 
من صور الزهور بالإضافة إلى عدد كبير من الصور الأخرى التي لا علاقة لها بالزهور. قد لا تحمل كل 
صورة علامة واضحة. ولكن من المعروف ما هي الصور التي تنتمي إلى مجموعة الزهور وأيها لا تنتمي. 


ويمكن بعد ذلك تدريب الشبكة على التمييز بين الزهور وغير الزهور, Bost‏ هذا الصدد. التمييز بين 
الصور والصور التي تم إنشاؤها من وحدات البكسل العشوائية. هذا المكون "المميز" الأولفي شبكة 
GAN‏ عبارة عن شبكة قياسية مدربة على تصنيف الأشياء. الإدخال هو مثال للبيانات التي نريد توليدها 
(مجموعة من صور الزهور إذا أردنا إنشاء صور زهور)ء بينما الإخراج هو علامة نعم/لا. 


الشبكة الأخرى هي المولد :generator‏ وهذا ينتج كمخرجات نوع البيانات التي تم تدريب المميز 
على تحديدها. لتحقيق هذا الإخراج» يستخدم المولد مدخلات عشوائية.في البداية» سيؤدي هذا إلى 
إنتاج مخرجات عشوائية» ولكن يتم تدريب المولد على نشر المعلومات بشكل عكسي» سواء كان 
ناتجها Gilis‏ للبيانات المطلوبة أم لا le)‏ سبيل المثال» صور الزهور). 


ولتحقيق هذه الغاية» يتم تغذية تنبؤات المولد إلى المميز. يتم تدريب الأخير على التعرف على الزهور 
الأصلية (في هذا المثال)؛ لذلك إذا كان المولد Gob‏ على تزييف زهرة بشكل جيد بما يكفي لخداع 
المميزء فيمكن لشبكة GAN‏ الخاصة بنا إنتاج صور مزيفة للزهور التي سيلتقطها مراقب مدرب oe‏ 
(المميز). 


إحدى طرق GAN (3 «SJ!‏ هي أنها غرفة يلتقي فيها المزور forger‏ والناقد الفني art critic‏ يقدم 
الأول لوحات مزيفةء مما يؤكد أصالتها؛ يحاول الأخير تأكيد ما إذا كانت هذه هي الصفقة الحقيقية أم 
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لا. إذاكان المزور als‏ جدَافي التزييف لدرجة أن الناقد يخلط بين اللوحات المزيفة واللوحات ALE‏ 
فقد يتم عرض اللوحات المزيفةفي المزاد على أمل أن يشتريها شخص ما... 

للوهلة الأولى؛ قد تبدو شبكات GAN‏ مشابهة للتعلم المعزز «reinforcement learning‏ لكن 
التشابه الواضح لا يصمد أمام التدقيق. تقوم GAN‏ بإنشاء شبكتين تتنافسان مع بعضهما البعض - 
الهدف هو زيادة مهاراتهما المتعارضة من أجل إنتاج بيانات مزيفة تبدو حقيقية. من ناحية أخرى. يقوم 
التعلم المعزز بفحص وكيل agent‏ واحد مقابل البيئة Lely‏ "تعزيز "reinforces‏ أو "معاقبة "punishes‏ 
الوكيل لتصحيح سلوكه. لا توجد منافسة ‏ مجرد نمط يجب اكتشافه من أجل البقاء. 

بدلاً من ذلك يمكن اعتبار شبكات GAN‏ بمثابة تعميم لمبدأ اختبار تورينج d :Turing test‏ 
هو المُختبر والمولد هو GLEN TV‏ اجتيازه والفرق الوحيد هو Gal‏ هذه الحالة كلا الممثلين عبارة 
عن آلات (انظر هنا لمزيد من التفاصيل حول BU‏ كانت أفكار تورينج أساسية للتعلم الآلي). 

GAN‏ محلية الصنع 

dale‏ ما تجد شبكات GAN‏ تطبيقاتها ÄI‏ إثارةفي الصور المزيفة .counterfeiting images‏ كما 
تمت مناقشته بالفعل. ومع ذلك» قد يتم إنشاء مقاطع فيديو ونصوص وحتى أصوات. على الرغم من 
أن المشكلات الفنية يمكن أن تؤدي إلى تعقيد تنفيذ "مولدات السلاسل الزمنية time series‏ 


"generators‏ هذه. 


في معظم البرامج التعليمية» يتم عرض إنشاء الصور الكلاسيكية؛ Bole‏ باستخدام مجموعة بيانات 
HN1‏ لتعليم RAS GAN‏ كتابة الحروف والأرقام. ومع ذلك فإن الشبكات التلافيفية 
convolutional networks‏ مطلوبة لهذه العملية» OU s‏ ما يتم إهمال GAN pare‏ نفسه لصالح 
تفاصيل حول إعداد الشبكات التلافيفية convolutional‏ و"غير التلافيفية "deconvolutional‏ التى 
تنفذ المُميِّر والمولد. بالإضافة إلى WS‏ يعد التدريب عملية طويلة جد عند عدم وجود ETR‏ 
المناسبة (يمكن العثور على وصف لشبكات GAN‏ هذهفي مساهمة أخرئفي مجلة (Codemotion‏ 
بدلاً من ذلك ما يلي هو شرح لشبكة GAN‏ بسيطة مبرمجة بلغة Python‏ باستخدام مكتبة Keras‏ 
(والتي يمكن تشغيلها على أي كمبيوتر محمول) لتعليمها LAS‏ رسم فئة معينة من المنحنيات. لقد 


اخترت المنحنى الجيبي «sinusoids‏ ولكن أي نمط آخر من شأنه أن يعمل بشكل جيد على قدم 
المساواة. 


m‏ سأوضح كيفية: 


.sinusoids إنشاء مجموعة بيانات من‎ ٠ 
إعداد شبكات المميز والمولد؛‎ e 
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ANS استخدامها لبناء‎ e 
مع توضيح كيفية الجمع بين تدريب مكوناتهاء و؛‎ GAN تدريب‎ e 


e‏ تأمل المنحني الجيبي sinusoid‏ المنحرف والمشوه إلى حد ما الذي رسمه البرنامج من 


الخ اء الف 


مجموعة بيانات اصطناعية 


بدلا من مجموعة من الصورء سأنتج وصمًا للمنحنيات التي أهتم بها: يمكن وصف sinusoids‏ رياضيًا 


على أنها رسم بياني للدوال: 


a sin(bx«c) 


-phase ad= frequency «»» 55 المنحنى‎ height هي المعلمات التي تحدد ارتفاع‎ c cb cac 
Python والتي تم إنتاجها عبر مقتطف‎ AJ يتم رسم بعض الأمثلة على هذه المنحنياتفي الصورة‎ 


import matpl 


otlib.pyplot as plt 


import numpy as np 
from numpy.random import randint, uniform 


X MIN = -5.0 
XNE = 60 


X COORDS - np.linspace(X MIN , X MAX, SAMPLE LEN) 


fig, axis - 


plr هت كرك‎ (iL, 1) 


for i in range(4): 
axis.plot(X COORDS, 


Mina ir orsa (Og iy 
uniform(2))) 


2«0) *np. sin (uncfoem(0-2,2.0) *X COORDS + 


—0.25 1 


—0.50 4 


-4 -2 0 2 4 


نريد أن تقوم شبكة GAN‏ الخاصة بنا بإنشاء منحنيات بهذا النوع من النماذج. لتبسيط الأمور, نعتبر 


. ce[0,x]; be[1/2,2] وليكن‎ a-1 
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AL‏ نحدد بعض الثوابت وننتج مجموعة بيانات من هذه المنحنيات. لوصف منحنى» لا نستخدم 
الشكل الرمزي symbolic form‏ عن طريق دالة الجيب» بل نختار بعض النقاطنفي المنحنى» مع أخذ 
عينات منها على نفس XM‏ ونمثل المنحنى y = f(x)‏ بواسطة المتجه ( 9717.....71) حيث = yl‏ 
f(xi)‏ ل xs‏ الثابتة. 

يتم إنشاء قيم y‏ باستخدام الصيغة السابقة للقيم العشوائية ل cy b‏ ضمن الفواصل الزمنية المحددة. 
وبعد تحديد مجموعة التدريب» يمكن رسم بعض هذه المنحنيات. 


import numpy as np 
from numpy.random import uniform 


import matplotlib.pyplot as plt 


SAMPLE LEN - 64 # number N of points where a curve is 
sampled 

SAMPLE SIZE = 32768 # number of curves in the training set 
كد‎ MIN = —950 # least ordinate where to sample 

K MES = Do # last ordinate where to sample 


# The set of coordinates over which curves are sampled 
X COORDS - np.linspace(X MIN , X MAX, SAMPLE LEN) 


# The training set 
SAMPLE = np.zeros((SAMPLE SIZE, SAMPLE LEN)) 
EOE 3L IM CAMEOS (O, SAMBELE SIAR) B 

lo; e UMN EO (0,5, 2.0) 

c = uniform(np.math.pi) 

SAMSKE] = np array INCE Satin (lose ur ©) EOE x< alia 
X COORDS] ) 


# We plot the first 8 curves 
riep ELE = ple SUES (il, 3b) 
iue 1 im EE (O) 8 
axis.plot(X COORDS, SAMPLE[i]) 
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GAN‏ في قطع صغيرة 


بعد AUS‏ نحدد المميز لديناء وهى الشبكة العصبية المستخدمة لتمييز المنحنى الجيبى عن أي مجموعة 
أخرى من نقاط العينة. وبالتالي يقبل eel‏ متجه الإدخال )1 (IN .... cy‏ ويعيد 1 إذا كان يتوافق مع 


منحنى um‏ وإلا 0. 


يتم بعد ذلك استخدام مكتبة Keras‏ لإنشاء كائن Sequence‏ يتم فيه تكديس الطبقات المختلفة 
للشبكة. تم ترتيب هذا المميز على شكل بيرسيبترون بسيط متعدد الطبقات multilayer‏ 
go «perceptron‏ ثلاث طبقات: طبقة الإدخال مع IN‏ من الخلايا العصبية. IN‏ هو حجم متجهات 
JOY‏ وطبقة ثانية بها نفس العدد من الخلايا العصبية المخفيةء وثالثة مع خلية عصبية واحدة ab‏ 


تخفض القيم السالبة 


طبقة الإخراج. 


تتم تصفية مخرجات المدخلات والطبقات المخفية بواسطة دالة "relu"‏ (التى 
للوسيط الخاص بها×) ومن خلال "التسرب "dropout‏ (الذي يضبط وحدات الإدخال بشكل عشوائي 
على 0 بتردد محدد أثناء کل خطوة من التدريب» لمنع الضبط الزائد overfitting‏ 


يتم تنشيط الخلية العصبية الناتجة عبر دالة sigmoid‏ التي تمتد بسلاسة من 0 إلى 1 وهما الإجابتان 


المحتملتان. 


from keras.models import Sequential 
from keras.layers import Dense, Dropout, LeakyReLU 


DROPOUT = Dropout(0.4) 


discriminator 


discriminator. 
discriminator. 
discriminator. 
discriminator. 
discriminator. 


= SSC 


uential () 
add (Dense (SAMPLE 


# Empirical hyperparameter 


EN, activation="relu") ) 


add (DROPOUT) 

add (Dense (SAMPLE LEN, activation="relu") ) 

add (DROPOUT) 

add(Dense(1, activation = "sigmoid") ) 
discriminator.compile (optimizer = "adam", loss = 

Woimary CroSSent ooy Semet Se = ١ 6 iN 


بعد ذلك نأتي إلى شبكة المولد. وهذا بمعنى ما مرآة للمميز؛ لا يزال LW‏ ثلاث طبقات. حيث تقبل 
طبقة الإدخال مدخلات مشوشة noisy input‏ بنفس حجم الإخراج (متجه مع (N pole‏ وتطبق 
دالة “leaky relu"‏ (التي تخفض القيم السالبة للوسيطة x‏ إلى قيمة صغيرة مضاعف × نفسه). ومع 
ذلك. فإن هذه الشبكة لا تقوم بالتسربء. وتخرج النتيجة عبر دالة الظل الزائدية hyperbolic‏ 
oY E tangent‏ التصنيف ليس هدفناء فإننا نستخدم متوسط مربع الخطأ mean square error‏ 
كدالة الخطأ You‏ من الإنتروبيا الثنائية cross entropy‏ عند تدريب الشبكة واستخدامها للتنبؤات. 


LEAKY RELU = 


generator = Sequential () 


LeakyReLU (0.2) 


# Empirical hyperparameter 


LN‏ شيكات الخصومة التوليدية 


Dense(SAMPLE LEN)) 


generator.add 


( 
generator.add(LEAKY RELU) 
generator.add(Dense(512)) 
generator.add(LEAKY RELU) 
generator.add(Dense(SAMPLE LEN, activation - "tanh")) 
generator.compile(optimizer = "adam", loss = "mse", metrics 


= [Wexeeusseue s" || )) 


بعد Ud‏ نقوم بتوصيل مخرجات المولد إلى المميز كمدخل» بحيث تكون شبكة GAN‏ بأكملها 


جاهزة للتدريب. 
gan = Sequential ()‏ 
gan.add(generator)‏ 
gan.add(discriminator)‏ 
gan.compile (optimizer = "adam", loss =‏ 
OLMA Crogsent ropy"; 1036:2168 = acouracy"])‏ 
كيف يتم تدريب SGAN‏ 


GAN‏ جاهز الآن للتدريب. بدلا من إطلاق طريقة fit‏ من Keras‏ فورًا على كائن gan‏ الذي أنشأناه 
للتوء فلنتوقف مؤقتا ونتأملفي مفهوم GAN‏ لفهم LAS‏ تدريبه بشكل صحيح. 

كما ذكرنا سابقاء يحتاج المُميّز إلى تعلم كيفية التمييز بين المنحني الجيبي والمنحنى الآخر. يمكن 
القيام بذلك ببساطة عن طريق تدريبه على مجموعة بيانات SAMPLES‏ الخاصة بنا ومجموعة بيانات 
مشوشة» ووضع علامات (تسميات) على العناصرفي المنحنيات الجيبية sinusoids‏ السابقة» وفي 
الأشكال غير المنحنيات الجيبية non-sinusoids‏ الأخيرة. 


المنتجات المزيفة التي ينتجها المولد. ومع أخذ obse YI ua‏ يتم تدريب المّميز على النحو التالي: 


1. لكل epochas‏ يتم إجراء التدريب الدفعي batch training‏ على كل من المميز والمولد. 

2 يبدأ هذا التدريب الدفعي بمطالبة المولد بإنشاء مجموعة من المنحنيات. 
يقترن ناتج ذلك بمجموعة من sinusoids‏ من مجموعة بيانات SAMPLE‏ الخاصة بناء 
ويتم توفير مجموعة بيانات تحتوي على تسميات 1 (- المنحني الجيبي الحقيقي) و0 (- 
المنحني الجيبي التي ينتجها المولد) لتدريب المُميّر على دفعات. وبالتالي يتم تدريبه على 
التعرف على المنحنيات الجيبى المتولدة من بين الأمثلة الحقيقية. 

d‏ يتم تدريب المولد على بيانات عشوائية: يتشر هذا الندريب بشكل عكسي على طول شبكة 
GAN‏ بأكملهاء ولكن يتم ترك الأوزانفي المميز دون تغيير. 


00 
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والنتيجة هي أن المميّز لم يتم تدريبه على التعرف على المنحيات الجيبيةء ولكن على المميز بين 
المنحنيات الجيبية من مجموعات البيانات لدينا والمنحنيات الجيبية التى ينتجها المولد. وفى الوقت 
نفسه» يتم تدريب المولد على إنتاج المنحنيات الجيبية من البيانات العشوائية لخداع المميز. 


عندما يكون معدل نجاح هذا الخداع مرتفعًا (من وجهة نظر «Great‏ تكون شبكة GAN‏ قادرة على 
توليد منحنيات جيبية. نظرًا لأننا نريد تنفيذ التعليمات البرمجية دون تجويع أجهزة الكمبيوتر المحمولة 
الخاصة بنا (وهو ما يمكن افتراضهفي حالة عدم وجود وحدات معالجة الرسوميات GPU‏ وما إلى 
CLUS‏ يتم استخدام معلمات صغيرة نسبيًا لإنتاج مجموعة البيانات الخاصة بنا وتدريب شبكة GAN‏ 
ولذلك لا يمكننا أن نتوقع أن ترسم الشبكة شكلا جيبيًا ناعماً؛ وبدلاً من ذلك نتوقع خطًا متذبذبًا إلى 
حد ما والذي يعرض مع ذلك نمطا جيبيًا. 

لتوضيح كيف تبداً GAN‏ بالرسم بشكل عشوائي» ثم تحسن تدريجيًا مهارتهاني رسم شكل جيبي أثناء 
"التدريب المهني “apprenticeship‏ قمت برسم بعض مخرجات GAN‏ التي تم إنشاؤها أثناء 
تدريبها (تم رسم 10 فترات» نظرًا WY‏ نستخدم 64 فترة فقطفي المجموع). 


NOISE = uniform(X MIN, X MAX, size = (SAMPLE SIZE, 
SAMPLE LEN)) 

ONES = np.ones((SAMPLE SIZE)) 

ZEROS = np.zeros((SAMPLE SIZE)) 

OEE (epocha || Cas, loss | cis, ace | gens loss | gen. sce”) 
prine (o ———— q——————-————- E q——————————- qp———————-—-—- 


fig = plt.figure(figsize = (8, 12)) 
ax index = 1 
for e in range (EPOCHS): 
for k in range(SAMPLE SIZE//BATCH): 
# Addestra il discriminatore a riconoscere le 
Sinusoidi vere da quelle prodotte dal generatore 
n = randint(0, SAMPLE SIZE, size = BATCH) 
# Ora prepara un batch di training record per il 
discriminatore 
p = generator.predict (NOISE[n]) 
x — np.concatenate((SAMPLE[n], p)) 
y = np.concatenate((ONES[n], ZEROS[n])) 
OL result = CI ECE MIRAE. دش ع‎ (Ow lochecla (x, 7) 
discriminator.trainable = False 
g result = gan.train on batch(NOISE[n], ONES[n]) 
discriminator.trainable - True 
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EIRENE (esOaia} || de 881015 |0015 كقح‎ | 

(oL 5 اطع لت‎ 8. 9} | (ej mesic [011] FOE) | 

(el restl [iL I] 8 SCI) 
# At 3, 13, 23, ... plots the last generator prediction 
if e $ 10 == 3: 


ax = fig-add subplot (Sy Ty e Andes) 
plt.plot(X COORDS, p[-1]) 

axo SEE o 8815_5115 11913 (ralse) 

jolie. yilas (TAEC le) 

gom dex Me 


# Plots a curve generated by the GAN 

y = Generator predvce (unt form (xX MIN; X ME, Size = (1; 
SAMPLE LEN)))[0] 

ax = frg.add subplot(8, 1, ax index) 


- 


plt.plot(X COORDS, y) 


الإخراج هو: 
epoch GES, loss (Chis, eer) gen. loss | gen. acc‏ 
oe 4----------‏ ت ت ن ت ن ن ا ت ت ت ت ت ت ت ت ت ن ت ا ت ت ت سام 
T3257 || O Staats‏ 0.96484 0.10589 0000 
AAS | 1 00000‏ 00000. 0.03285 0001 
1.00000 | 9.54678 00000. 0.01879 0002 
JL 53168151017) .00000‏ 00000. 0.01875 0003 
Sic MOUS) .00000‏ 00000. 0.00816 0004 
ONO 0. SOUS 6.46034 0. SOUS‏ 0005 
TOASTS 00000 Sale Spe) .00000‏ 0006 
T GI .00000‏ 00000. 0.00189 0007 
00000. 6 1 00000. 0.00688 0008 
eh s 8 .00000‏ 00000 0.00306 0009 
00000. 24.427166 00000. 0.00045 0010 
00000. 8.18817 00000. 0.00137 0011 
0.98438 7.04744 0.98438 0.06852 0012 
e SHIT 4.13820 0.91797‏ 025 0013 
O SMSO 39265 0) HITE‏ 0.17984 0014 
a SHIT 20522 0.91787‏ 005989 0015 
i9) GT O 2, OO 0.91797‏ 0.20050 0016 
0.90625 2.62364 0.90625 0.24295 0017 
Ones 20s‏ 1.88428 0.83203 0.34922 0018 
ORZ5 508 0.88281 2.24889 0.88281‏ 0019 
0.88281 1.8442 0.88281 022527 0020 
O 2210 0.88672 JL AIS 0.88672‏ 0021 
Zeb sm 0.88672‏ 0.88672 0.30241 0022 
QBS 0.82422 2. 026 0.82422‏ 0023 
0.86328 2.46216 0128/69218 026693 0024 
0.82422 1.64815 0.82422 0.39710 0025 
0.83984 2.34444 0.83984 0.34780 0026 
OSG 0.90625‏ 2 0.90625 0.26145 0027 
0.86328 52 11 2 0.86328 0.28858 0028 
2S 0.83984‏ 0.83984 0221 0029 
DEOR 0.86719 ONS O SGT‏ 0030 
TATIL 0.89844 192523 0.89844‏ 0031 
Ma SLAST 0.87500 2.10098 0.87500‏ 0032 
0.83984 2.03964 0.83984 0.38449 0033 
72d 0.81641‏ 0.81641 0.34802 0034 
0.87500 05 1 0.87500 0.28982 0035 
0.85156 1.83760 0.85156 0.33509 0036 
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0037 0.29839 On 8679 .90305 0.86719 
0038 0.34962 0.83594 -86196 0.83594 
0039 0.32271 0.84766 2.21418 0.84766 
0040 0.31684 0.84766 2.22909 0.84766 
0041 01539983 0.83984 .79734 0.83984 
0042 0.31909 0.83984 20S 0.83984 
0043 0.30426 0.86719 .98194 0.86719 
0044 0.30465 0.86328 QUOI SB 0.86328 
0045 0.35478 0.84766 2.40368 0.84766 
0046 0.30423 0.86328 o SSH 0.86328 
0047 0.30887 0.83984 217885 0.83984 
0048 01235123 07:86:19 2.00351 0.86719 
0049 0.24366 0.90234 2.21016 0.90234 
0050 O SO 0.84375 299395 0.84375 
0051 0.35846 0.84375 215/889 0.84375 
0052 0.35476 0.83203 QUIS 0.83203 
0053 0.28164 0.87109 26057, 0.87109 
0054 0725782 0.89844 -87386 0.89844 
0055 0.28027 0.87500 2-305177 0.87500 
0056 Os sible 0.84375 2.00939 omea ors 
0057 0.32034 0.85547 272250 0.85547 
0058 0.34665 0.84375 218842 0.84375 
0059 0.32069 O SSSA 11 0.85547 
0060 0.32578 0.87500 289505 0.87500 
0061 9012320167 0.87109 1L 9/10/5215 0.87109 
0062 0231929 0.85938 9990 0.85938 
0063 0.38814 0.83984 1.55212 0.83984 
[<matplotlib.lines.Line2D at 0x1b5c3054c48>] 


Epoch: 3 
o e 


Epoch: 23 
boo 
non 


Epoch: 33 
boo 
مآ‎ 5 


-1 T T T 


شيكات الخصومة التوليدية 


لاحظ of‏ الصورة الأولى» بعد TORIO,‏ تكون عشوائية إلى حد ماءفي حين تتحرك الصور اللاحقة 
نحو منحنى أكثر نعومة(حتى لو كانت فتراتنا ال 64 غير كافية لمنحنى جيد (Io‏ والأهم من ذلك 
نحو منحنى أكثر نعومة. يعرض الاتجاه الجيبية. 

ما يمكن ملاحظته Cal‏ هو تقدم الخطأ والدقة لكل من شبكة dE‏ والمولد بأكملها أثناء التدريب. 
عند فحص هذا السجل» يمكننا أن نرى أنه كلما انخفضت قيمة خطأ «GAN‏ كان المنحنى يقترب 
بشكل أفضل من الشكل الجيبي. ST‏ عند فحص قيم Grell‏ من الواضح أن بعض التعديلاتفي 
المعلمات الفائقة (أو حتىفي معمارية الشبكات) صحيحة. 


الاستنتاج 

المثال الذي لعبنا به هنا قد لا يبدو مثيرا للإعجاب بشكل خاصء ولكن ينبغي أن يكون WIS‏ حقا.في 
سياق هذه المقالة» تم تجميع شبكتين سطحيتين يمكن برمجتهما (بغض النظر عن dropout‏ و leaky‏ 
ürelu‏ أواخر الثمانينات. ومع ذلك OB‏ وضع هذه الشبكاتفي مواجهة بعضها البعض في المنافسة قد 
أنتج شبكة توليد "ترسم" منحنيات تشبه تلك التي يتم تغذيتها بها. 

علاوة على WS‏ تتعرف الشبكة على النماذج التي يجب تقليدها من مجرد وصف نموذجي صغيرء 
ومن المحتمل أن يستغرق تشغيل البرامج على جهاز الكمبيوتر الخاص بك بضع دقائق على الأكثر. 
ومن خلال الجمع بين شبكات أكثر تطورًا على نفس المنوال» يمكن إنشاء شبكة GAN‏ قادرة على 
إنشاء أرقام أو أحرف أو أشكال أكثر تعقيدا. بعض التعديلاتفي تقنيات التدريب وفي تمثيل البيانات 
من شأنها أن تسمح ل GAN‏ بإنشاء خطابات ومقاطع فيديو وفي المستقبل القريب. أي شيء يوجد 
الكثير من الأمثلة عليه على الويب» أي كل شيء IG us‏ 


المصدر: 


https://www.codemotion.com/magazine/ai-ml/deep-learning/how-to-build-a- 


gan-in-python/ 
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4( كيفية برمجة شبكة الخصومة التوليدية (GAN)‏ في 
بايثون How to code a Generative Adversarial‏ 
Network (GAN) in Python‏ 


الشبكات !4.20 dx 4 53 Neural networks‏ هذه المقالة» قمنا ببرمجة شبكة عصبية من الصفر 
بلغة Python‏ وإظهار كيفية استخدام الشبكات العصبية التلافيفية convolutional neural‏ 
9 لتصنيف الصور. واليوم سنذهب خطوة أخرى إلى الأمام. سنتعلمني هذا المنشور كيفية 
برمجة (3generative adversarial network (GAN)‏ لغة Python‏ لإنشاء صور مزيفة fake‏ 
images‏ يبدو عظيماء أليس كذلك؟ لنفعلها اذا!. 


تحضير الاسكريبت الخاص بنا على Google Colab‏ 

ملحوظة: إذا كنت تعرف الآن كيفية عمل Google Colab‏ وكيف يمكنك تمكين وحدة معالجة 
الرسوميات GPU‏ وحفظ/قراءة الملفات من Colab (3Drive‏ فتخط هذا الجزء. 

كما تعلم» فإن Google Colab‏ هي خدمة مجانية لتعلم علم البيانات. يسمح لك بشكل أساسي بتنفيذ 
Jupyter Notebooks‏ المكتوبة بلغة Python‏ على -Google esl‏ 

في هذا الصدد. من بين المزايا العديدة التي يقدمها Google Colab‏ أود أن أشير إلى أنه يمكننا من 
تدريب شبكاتك العصبية على وحدة معالجة الرسوميات GPU‏ مجانًا. سيؤدي ذلك إلى جعل عمليات 
التدريب الخاصة بك أسرع بكثير من القيام بذلك عبر وحدة المعالجة المركزية CPU‏ وهو أمر رائع 
في حالة عدم وجود جهاز كمبيوتر مزود بوحدة معالجة رسومات قوية. 

لتمكين GPU‏ على «Colab‏ يجب عليك: 


:"Change Execution Environment’ (J! انتقل‎ .1 


Ejecutar todas 38/Ctri+F9 


Ejecutar anteriores 38/Ctri+F8 


Ejecutar selección $€/Ctri+Shift+Enter 


Ejecutar siguientes 3€/Ctri+F10 


Restablecer estado de fábrica del entorno de ejecución 


Cambiar tipo de entorno de ejecución 


Gestionar sesiones 


LG‏ شيكات الخصومة التوليدية 


.hardware accelerator كمسرع للأجهزة‎ GPUs» .2 


Configuración del cuaderno 


Acelerador por hardware 
A 


GPU 


pa 


LI Omitir resultado de las celdas de código al guardar este cuaderno 


CANCELAR 


وبھذا سيكون لدينا إمكانية الوصول إلى oY .GPU‏ علينا أن نجعل Tensorflow‏ يستخدمه. 


وللقيام بذلك علينا تشغيل الكود التالي: 


import tensorflow as tf 
device name = tf.test.gpu device name () 
adr device neme l= de g 
raise SystemError('GPU device not found') 
BEANE (rowne CEU aws DT TOMI (Cevc neme) ) 


Found GPU at: /device:GPU:0 
.GPU على وحدة معالجة الرسوميات‎ Tensorflow الآن سيتم تشغيل كل ما نصنعه على‎ 


ومن ناحية أخرى. Cad "D‏ بالاتصال ب Google Drive‏ حتى نتمكن من حفظ جميع نقاط الحفظ 
checkpoints‏ والصور التي ننشتها. 
وذلك لأن أحد العيوب الرئيسية لاستخدام Google Colab‏ هو del‏ مرحلة ما سوف يقوم بفصلك 


لتوصيل Colab‏ مع «Drive‏ تحتاج فقط إلى تشغيل سطر من التعليمات البرمجية» وإدخال عنوان 
URL‏ ولصق هذا الكودني -Colab‏ 


from google.colab import drive 
Import OS 
drive.mount ('/content/gdrive/') 


Go to this URL in a browser: 
https://accounts.google.com/o/oauth2/auth?client id-12345678 
91.2:3— 
6bn6qk8qdgf4n4g3pfee6491hcObrc4i.apps.googleusercontent.com& 
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redirect uri-urn$3aietf$3awg£$3aoauth$3a2.0$3aoob&response ty 
pe-code&scope-email$20https£$3a$2f$2fwww.googleapis.com$2faut 
h$2fdocs.test$20https$3a$2f$2fwww.googleapis.com$2fauth$2fdr 
ive$20https$3a$2f$2fwww.googleapis.com$2fauth$2fdrive.photos 
.readonly$20https$3a$2f$2fwww.googleapis.com$2fauth22fpeople 
api.readonly 


Enter your authorization code: 


Mounted at /content/gdrive/ 
حيث تريد تخزين نتائجك. يمكنك القيام بذلك على‎ Drive thes علاوة على ذلك تحتاج إلى اختيار‎ 


النحو التالي: 


$cd /content/gdrive/MyN Drive/Red \Neuronal \Generativa 
NAntagonica 


/content/gdrive/My Drive/Red Neuronal Generativa Antagonica 


وبهذا تكون بيئتنا جاهزة بالفعل. لذا... دعونا نتعلم LAS‏ برمجة شبكة الخصومة التوليديةفي !Python‏ 


المولد/المميز هو اساس شبكة الخصومة التوليدية 
لإنشاء شبكة عصبية تولد o pall‏ سنحتاج إلى شبكتين عصبيتين مختلفتين: 
e‏ الشبكة التوليدية :Genervative network‏ تقوم هذه الشبكة العصبية بإنشاء الصور. 
في البدايةء ستولد هذه الشبكة ضوضاء فقطء لذا سنحتاج إلى تدريبها حتى تولد صورًا أكثر 
واقعية. 
e‏ الشبكة التمييزية :Discriminator network‏ تقوم هذه الشبكة بتصنيف ما إذا كانت 
الصورة حقيقية أم لا. هذه هي الشبكة التي ستمكننا من تدريب الشبكة التوليدية. 
لإنشاء شبكتنا العصبية سوف نستخدم keras‏ ومع US‏ نظرًا لتفرد هذه abl‏ فلن يكون الأمر سهلاً 
مثل إضافة الطبقات بشكل تسلسلى. بدلا من ذلك» سيتعين علينا Las‏ كل خطوة على حدة حتى 
نتمكن GN‏ من توصيل الشبكتين. 
وفي نهاية المطاف. يتم استخدام نتائج الشبكة التمييزية من قبل الشبكة التوليدية لضبط معلماتهاء كما 
فى المثال أدناه: 


شيكات الخصومة التوليدية 


» fake/real 


probability 


Random 
Noise z — 


ولکن» كيف يمكننا برمجة شبكة df Python gos GAN‏ حالتناء سوف نستخدم مجموعة بيانات 
0 التي تحتوي على 50000 صورة ل 10 كائنات مختلفة بحجم 32 x‏ 32. يمكنك التحقق 
من مجموعة البيانات بأكملها هنا. 
في حالتناء سنستخدم فقط صور الطائرات مجموعة البيانات» على الرغم من أن النموذج سيعمل بشكل 
رائع مع أي أنواع أخرى من الصور. 
ومع ذلك. هل تريد أن تتعلم LAS‏ برمجة شبكة الخصومة التوليدية Ue» SPython G(GAN)‏ نقوم 


la 


كيفية برمجة GAN‏ في بايثون 

أول شيء يتعين علينا القيام به لبرمجة كل من GAN‏ هو معرفة معمارية كل من المولد generator‏ 
والمميز discriminator‏ مدخلات الشبكة التوليدية هي متجه للضوضاء est» -vector of noise‏ 
بترقية هذه الشبكة حتى نجعلها مصفوفة بحجم :32x32x5‏ 

فكرة الشبكة بسيطة: من خلال الضوضاء العشوائية random noise‏ سنقوم بدمج البيانات حتى نقوم 
بإنشاء صورة.في A‏ ستكون الصور ضوضاء عشوائية أيضاء ولكن كلما قمنا بتدريب الشبكة 
التوليديةء كلما كانت النتائج أفضل. 


الآن بعد أن أصبحت الفكرة واضحةء فلنقم ببرمجتها! 


برمجة الشبكة التوليدية 
أول شيء يتعين علينا القيام به هو تحميل الدوال التي سنستخدمها.في هذه الحالة سأستخدم: 
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:Dense e‏ إنها طبقة الضوضاء الخاصة بمولدنا. 

:Conv2D Transpose e‏ يتيح هذا إمكانية الالتفاف EU‏ أي ترقية الصورة ودمجهاني 
نفس الوقت. وهو يعادل استخدام الدالة UpSampling2D‏ متبوعة ب -Conv2D‏ 

-gradient vanish لأنه يتجنب اختفاء التدرج‎ .ReLU من دوال‎ Jñ :LeakyReLU ٠ 

:BatchNormalization e‏ يمكن من تسوية نتيجة الالتفاف convolution‏ وهذا سوف 
يساعدنا على الحصول على نتائج أفضل. وفي حالتي لم أستخدمه لأنه بعد تجربته لم يحسن 
النتائج. 

ces :Reshape e‏ لنا ذلك تحويل متجه أحادي البعد إلى مصفوفة ثلاثية الأبعاد. 


بالإضافة إلى ذلك علينا أن نأخذفي الاعتبار أن شكل مخرجات الشبكة التوليدية يجب أن يكون هو نفس 
شكل الصور الحقيقية. ولتحقيق ذلك سنستخدم الدالة «Conv 2DTranspose‏ لكن كيف نعرف 
لشكل الذي سنحصل عليه؟ 

وفي هذا الصدد» سوف نستخدم الخطوات strides‏ تشير الخطوات إلى مقدار تحرك النواة من أجل 
الالتفاف. على سبيل المثالءفي حالة صورة مقاس 18 x‏ 18( إذا طبقنا التفافًا بنواة مكونة من 3 وخطوة 
مكونة من 3( فستكون النتيجة النهائية صورة مقاس 6 x 18/3) 6 x‏ 18/3). 


على العكس من ذلك. إذا أردنا زيادة حجم الصورة باستخدام «Conv2DTranspose‏ فسنستخدم 
الخطوات أيضًا. على سبيل المثالء إذا أردنا الانتقال من صورة مقاس 6 x‏ 6 إلى صورة مقاس 18 x‏ 
18( فسنحتاج إلى الحفاظ على خطوة واحدة. 


من ناحية 2 ds‏ الطبقة TRES‏ سنستخدم tangent Jl»‏ بحيث نحصل على قيم من -1 إلى 1. 
السبب؟ المحاولة والخطأ. لقد قمت أولاً بتجربة دالة sigmoid‏ ولكنها لم تعمل بشكل جيد. 


وأخيرًاء من المهم الإشارة إلى Lal‏ نقوم فقط بتعريف معمارية الشبكة التوليدية. نحن لا نحاول تدريبها. 


import keras 

from keras.layers import Dense, Conv2DTranspose, LeakyReLU, 
Reshape, BatchNormalization, Activation, Conv2D 

from keras.models import Model, Sequential 


def generador de imagenes(): 
generador = Sequential() 
generador ¢ add (Dense SGA A علض ة‎ shape = (100), )) 9) 
#generador.add(BatchNormalization() ) 


generador.add(LeakyReLU () ) 
generador .add (Reshape ((4,4,256) ) ) 


شبكات الخصومة التوليدية 


generador.add(Conv2 
strides=2, padding = 


#generador.add(BatchNormalization() ) 


generador .add (Leaky 


generador .add (Conv2 
strides=2, 


ReLU (alpha=0.2)) 


#generador.add(BatchNormalization() ) 


generador .add (Leaky 


generador . 200 (Conv2 
strides=2, 


ReLU (alpha=0.2)) 


#generador.add(BatchNormalization() ) 


generador .add (Leaky 


generador .add (Conv2 
activation-'tanh')) 


return (generador) 


modelo generador - 


ReLU (alpha=0.2) ) 


Die karnel size=5, pasan 


generador de imagenes () 


modelo generador.summary () 


Using TensorFlow backend. 


less el Sze,‏ ,)1.25( تدان هرك 10 6 ارقا 
LJ) )‏ اللا 


Dig amsposciilo pcnc Sez c em 
padding = "same")) 


DUransposed(t28j)keenelgsTze-3, 
padding = "same")) 


Model: "sequential 1" 

Layer (type) Output Shape Param # 
|": won dismee 
leaky re lu 1 (LeakyReLU) (None, 4096) 0 
reshape 1 (Reshape) (None, 4, 4, 256) 0 
conv2d transpose 1 (Conv2DTr (None, 8, 8, 128) 295040 
leaky re lu 2 (LeakyReLU) (None, 8, 8, 128) 0 
conv2d transpose 2 (Conv2DTr (None, 16, 16, 128) 147584 
leaky re lu 3 (LeakyReLU) (None, 16, 16, 128) 0 
conyv2ditranspose Cony Dini None 32, 2, 2/8) 147584 
leaky re lu 4 (LeakyReLU) (Noma, S42, 527 128( 0 
conv2d 1 (Conv2D) (None; 32, S25 3) 3459 


"same" / 
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morel params: OO 9 
Trainable params: 1,007,363 
Non-trainable params: 0 


بهذا نكون قد انتهينا للتو من هيكل الشبكة التوليدية. دعونا نتحقق مما إذا كان يعمل بشكل جيد. 
se e. Jl‏ .. مماإذا كانت i ^ Jl‏ 5 التوليدية .. | 
وبما أن الشبكة لم يتم تدريبها بعدء فمن المفترض أن تقوم بإنشاء صور عشوائية. دعونا نرى ذلك. 


import matplotlib.pyplot as plt 
import numpy as np 


* Definir datos de entrada 

def generar datos entrada(n muestras): 
X = np.random.randn(100 * n muestras) 
X — X.reshape(n muestras, 100) 
Tetum IX 


det Crear datos fake (modelo generador,, m miestas) s 
input = generar datos entrada(n muestras) 
X = modelo generador.predict (input) 
y = DO. 4ecOs ( (n UES, 1)) 
SEMER Kyy 


numero muestras = 4 
X, = crear datos fake(modelo generador, numero muestras) 


f Visualizamos resultados 

TOS 3L in range (MUMS muestras) B 
ple EULER, 2, ii => 1) 
jolie aS SOE E U) 
plt.imshow(X[i]) 


Clipping input data to the valid range for imshow with RGB 
Carca (IC. Jb] owe itlogcs or [0-259] EOE 1526-0 c 
Clipping input data to the valid range for imshow with RGB 
Cata (0. .i]) FOC logics cue (OM. 22959] EOC aincecgeics)) s 
Clipping input data to the valid range for imshow with RGB 
Caca (Oos coe lofts or [0.259] EOE agas) s 
Clipping input data to the valid range for imshow with RGB 
cere (0-2 I] EO 225255 om [0s 255] kom anitegersi) o 


شيكات الخصومة التوليدية 


إنها تعمل! كما ترون» فإنه يولد الضوضاء etd‏ ولكن هذا بالضبط ما توقعناه. على أية حال» لقد انتهينا 
للتو من الخطوة الأولى لإنشاء شبكة GAN‏ باستخدام Python‏ الآن دعونا نرى LAS‏ إنشاء الشبكة 
التمييزية! 

بر Ul E ^ ^ JI Em a‏ ييزية 


شبكتنا التمييزية هي شبكة dues‏ تلافيفية convolutional neural network‏ عادية. سوف 


يستغرق صورة كمدخل وسيقوم الإخراج بإرجاع قيمة ABUS‏ 

على الرغم من وجود شبكة تلافيفية» فمن المستحسن استخدام الطبقات المتسربة dropout layers‏ 
بعد كل تلافيف لتجنب الضبط الزائد coverfitting‏ وفى IL‏ فقد استخدمتها فقط على الطبقة 
الأخيرة. مرة أخرى فعلت ذلك بعد أن حاولت ورأيت أنه لم يحسن أداء النموذج. 

من ناحية أخرى» على هذه الشبكة. سوف نستخدم دالة التنشيط Gsigmoid‏ الطبقة الأخيرة. كما علقت 
على هذا المنشور. عندما نريد تصنيف صورتين» فإن دوال التنشيط sigmoid‏ تعطي احتمالية أن تكون 
الصورة من المجموعة المستهدفة. 

عندما يتعلق الأمر nell‏ سنستخدم Adam doe‏ لأنه يعمل بشكل جيد بشكل خاص مع 
مجموعات البيانات الكبيرة وعادة ما يعمل بشكل أفضل من التدرج الاشتقاقي -Gradient Descent‏ 
علاوة على ذلك على الرغم من أننا ale‏ ما نستخدم معدل التعلم learning rate‏ الافتراضي 
والإصدارات التجريبية. في e « Au oda‏ توصيات هذه الورقة. والتى تشير إلى تعيين معدل تعلم 
قدره 0.0002 وبيتا قدره 0.5. 


from keras.layers import Conv2D, Flatten, Dropout 
from keras.optimizers import Adam 


def discriminador de imagenes(): 
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discriminador = Sequential ()‏ 
discriminador.add(Conv2D(64, kernel size-3, padding =‏ 

SMS, MOE shaps = (32,22529»)) 
discriminador.add(LeakyReLU(alpha-0.2)) 


#discriminador.add (Dropout (0.2) ) 


discrim 


discrim 


inador.add(Conv2 
kermel Satz shexilolesE (2,2) r 
inador.add(Leaky 


D 


(128, 


padding = "same") ) 


ReLU (alpha=0.2) ) 


#discriminador.add (Dropout (0.2) ) 


discrim 


discrim 


inador.add(Conv2D 
kernel fares Str ridees (2,2) r 
inador.add(Leaky 


(1287 


padding = "same")) 


ReLU (alpha=0.2)) 


#discriminador.add(Dropout (0.2) ) 


discrim 


strides=(2,2), p 


discrim 


inador.add(Conv2D 
adding = 
inador.add (Leaky 


(2567 


Ws cue | ) 


ReLU (alpha=0.2) ) 


#discriminador.add (Dropout (0.2) ) 


discrim 
discrim 
discrim 


opt 


discrim 


= 1 


optimizer= opt , 


return (discriminador) 


r=0.0002 


inador.compile 


metrics 


,be 


(HOSS " binary CEOS E rooy" y 
= | 2002397 1) 


inador.add(Flatten()) 
inador.add(Dropou 
inador.add(Dense(l1, 


t(0.4)) 


kernel sizes; 


activation='sigmoid') ) 


ze i055) 


modelo discriminador = discriminador de imagenes () 
modelo discriminador.summary () 


Model: "sequential 2" 

Layer (type) Output Shape Param # 
conv2d 2 (Gonv2D) (None, 32, 32, 64) ++ (1792 
leaky re lu 5 (LeakyReLU) (None, 32, 32, 64) 0 

conv2d 3 (Conv2D) (None, 16, 16, 128) 73856 
leaky re lu 6 (LeakyReLU) (None, 16, 16, 128) 0 

conv2d 4 (Conv2D) (None, 8, 8, 128) 147584 
leaky re lu 7 (LeakyReLU) (None, 8, 8, 128) 0 

conv2d 5 (Conv2D) (None 4, 4, 256) 295168 


شيكات الخصومة التوليدية 


leaky re lu 8 (LeakyReLU) (None, 4, 4, 256) 0 
flatten 1 (Flatten) (None, 4096) 0 
dropout 1 (Dropout) (None, 4096) 0 
dense 2 (Dense) (None, 1) 4097 


Total params: 922, 490 
Trainable params: 522,497 
Non-trainable params: 0 


بهذا نكون قد انتهينا للتو من هيكل المُميّر. ومع ذلك. لا تزال هناك بعض الأمور المهمة التي ينبغي 
علينا القيام بها: 
e‏ إنشاء شبكة GAN‏ الخاصة بنا: لقد قمنا حتى الآن بإنشاء الشبكتين: لكنهما غير 
متصلتين بعد. سنحتاج إلى ربطهما معًا. 
e‏ تحديد دالة التدريب: هذا سيجعل شبكتنا التوليدية تتعلم.في هذه الخطوة سنقوم Gaf‏ 
بتضمين النقطة التالية. 
e‏ حفظ نتائج شبكتنا: سنقوم بحفظ أوزان الشبكة والصور التي ELIS‏ النهاية» نريد 
جميعًا أن نتحمّس لرؤية كيف تتدرب الشبكة وتتحسن. 
كما ترون. لا يزال هناك الكثير من الأشياء التي يتعين القيام بهاء لذلك دعونا ننجزها! 
الخطوات الأخيرة لإنشاء GAN‏ في بايثون 
تحميل البيانات من Cifar10‏ 
لتدريب شبكة GAN‏ الخاصة بناء نحتاج أولاً إلى تحميل مجموعة البيانات من -Cifarl0‏ 
علاوة على ذلك سنقوم بتسوية البيانات liag normalize the data‏ سيجعل النموذج يعمل بشكل 
أسرع. للقيام UL‏ عندما تنتقل طبقة RGB‏ من 0 إلى 255( سنطرح ثم نقسم 127.5. وبذلك 
ستنتقل القيم من -1 إلى 1. 


from keras.datasets import cifarl0 


def cargar imagenes(): 
(KEEN, EAMG; (a I = Carl O. loas! Cece (()) 


# Nos quedamos con los perros 
indice = np.where(Ytrain == 0) 
indice = indice[0] 

E لكك ص‎ = Kerema MONO 8, 848 || 


co 
ol 
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# Normalizamos los datos 
X = Xtrain.astype('float32') 
Xe (6K SIA eds 7 5 


return X 


print (cargar imagenes ().shape) 


Downloading data from 
https://www.cs.toronto.edu/~kriz/cifar-l0-python.tar.gz 
170500096/170498071 [ ] = 6s 
Ous/step 

(5000, 32, 32, 3) 


حقيقية real‏ ومزيفة fake‏ لذلك سنقوم بإنشاء دالة تولد ذلك بالضبط. 


من أجل إنشاء صور مزيفة» من المهم إنشاء صور لها نفس شكل الصور الحقيقية. كما Ub‏ من قبلء 
الصور الحقيقية هي مصفوفات بأبعاد 32×32×3. لذلك سنحتاج إلى إنشاء n ode‏ من الصور بهذا 


الشكل. 


علاوة على ذلك ينصح البعض بإعطاء العلامة 0 للصور المزيفة لتحسين الآداء. بعد عدة محاولات؛ 
رأيت تحستا طفيفًا من خلال القيام بذلك. لذلك قمنا بتعيين الصور المزيفة كتسمية 0. 


import random 


def cargar datos reales(dataset, n muestras): 
ix — np.random.randint(0, dataset.shape[0], n muestras) 
X = dataset[ix] 
yV = no OMNES ( (m misstas, 1y) 
لات‎ K Sy, 


def cargar datos fake(n muestras): 
X= mp CAMEOS celal (32 = 32 ** 3 ** m mosstras) 
$c ج‎ Hi ap ow 
X = X.reshape( 
y = np.zeros(( 
SEMER Ky 


الآن وقد أصبح لدينا مولد الصور الحقيقية والمزيفة وسنستخدمه لتدريب الشبكة التمييزية الخاصة بنا. 
من المهم تدريب Sall‏ مسقا لأنه عندما نقوم بتدريب GAN‏ سنقوم فقط بتدريب oS gol‏ وليس 
المميز. 


(m 622-57 34, 32, 33) )) 
nomuestras, 1) 


شبكات الخصومة التوليدية 


للتأكد من أن المميز قد تدربت بشكل صحيح» سنحصل على دقة البيانات الحقيقية والمزيفة ونرى ما 


للتدريب» سنمرر نصف البيانات المزيفة والنصف الآخر من البيانات الحقيقية. ومن ثم نحسب 
يسا مر ب يمه و جر عن c‏ يفية. ومن نم - 
:medio batch‏ 


def entrenar discriminador (modelo, dataset, 
m iceraciones=20; boaten = 35219) 8 
medio batch = int (batch/2) 


Tor 3L in rengen Lteraciones) e 
X real, y real = cargar datos reales(dataset, 
medio batch) 
p ACE real = MOCO, train Om barcch (X real, y zeal) 


X fake, y fake = cargar datos fake(medio batch) 
p BSC fake = 121661516 trein on ECER taks, y Take) 


prine (eese (dril) «ar " Reals r err (eCe real LOO) + Y, 
Pekel“ t err (ece taker LON) 


الآن بعد أن حصلنا على كل قطعناء علينا أن نجمعها معًا لتدريب الشبكة التمييزية لدينا: 


dataset = cargar imagenes) 
entrenar discriminador (modelo discriminador, dataset) 


Reals 762125; wales i, 5625) 
Rel SO SIS, Fakss il 5625 
REALE 25 3125, Paka: 2.5625 
Real:98.4375, Fake:56.25 
Reals OS 3125, bakes 0 19 
REALE 55 55 57 wales 100.0 
Rawls ساف‎ is V's, Faka: 000 
Reall: 75-0; wakes loo. O 

9 Real : 5 I25, Feks: 100.0 
10 Reales 247 SVS, Kake- 000 
ii Rees. 75, Fakas 100-0 


Oi 855 ان‎ TES ين‎ Iso) S 


12 Reale 
LS Real; 
14 Real: 
15 Real 
16 Real: 
iy Reals 
18 Real: 
19 Real: 
20 Real: 


92 c dL T E 
98.4375, 
LOO @, jme 
E A, 
98. 3325; 
OOO ie 
100-0; Fa 
100.0, Fa 
DIOSES NO 


Fake:100.0 
Fake:100.0 
ke:100.0 
Fake:100.0 
Fake:100.0 
ke:100.0 
ke:100.0 
ke:100.0 
Fake:100.0 
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لقد قمنا للتو بتدريب شبكتنا التمييزية! كان ذلك Sign‏ أليس كذلك؟ الآن بعد أن أنشأنا AS‏ من الشبكة 
التوليدية والشبكة التمييزيةء فلنقم ببرمجة شبكة الخصومة التوليدية (GAN)‏ الخاصة !Python Gly‏ 


برمجة شبكة الخصومة التوليدية لدينا 
الآن بعد أن أصبح لدينا جميع أجزاء شبكة الخصومة التوليدية» علينا أن نجمعها معًا بحيث يقوم المولد 
بإنشاء صور ويقوم المميز بتصنيف ما إذاكانت الصور حقيقية أم لا. 


وبما أن المميز قد تم تدريبها بالفعل» فسوف نقوم بتعيين المعلمة القابلة للتدريب على أنها .FALSE‏ 
علاوة على ذلك» ستكون دالة التكلفة (الخطأ) binary crossentropy‏ حيث ستساعدنافي تصنيف 


الصور بين مزيفة (0) وحقيقية (1). 


def crear gan(discriminador, generador): 
discriminador.trainable-False 
gan = Sequential () 
gan.add (generador) 
gan.add(discriminador) 


opt = Adami IE O. OO, bere 1-05) 
Cela COmosLIla (loss e» Moineary Crosgentrooy p Optimizer = 
opt) 


return gan 


gan = crear gan(modelo discriminador,modelo generador) 
gan.summary() 


Model: Segue ELAN sw 


Layer (type) Output Shape Param # 
sequential 1 (Sequential) (None, 32, 32, 3) 1007363 
sequential 2 (Sequential) (None, 1) 522497 


ToEal params 1, 512 S17 60 
Trainable params: 1,007,363 
Non-trainable params: 522,497 


لقد قمنا للتو ببرمجة شبكة الخصومة التوليدية !Python G(GAN)‏ الآن علينا فقط تحديد حلقة 
التدريب الخاصة بالشبكة وبعض الأشياء الأخرى التى نريد التحقق منها أثناء عملية التدريب» مثل الدقة 
أو الصور التي تم إنشاؤها. 

للقيام بذلك» سأقوم بإنشاء دالتين: واحدة لحساب وحفظ الخطأ وأوزان النموذج والأخرى لحفظ 
الصور التي تم إنشاؤها. 
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دول تقييم النماذج وتوليد الصور 

سنبدأً بالدالة التي تحفظ نتائج النموذج. للقيام UL‏ ونظرًا لمجموعة من الصور التي تم إنشاؤهاء 
سأقوم بتخزين 10 Age‏ وهكذاء ت تمكنت من رؤية كيفية تحسين GAN‏ وتمكنت Cast‏ من إنشاء ملف 
(GIF‏ هذا المنشور. 


import pandas as pd 

import matplotlib.pyplot as plt 
$matplotlib inline 

from datetime import datetime 


def mostrar imagenes generadas(datos fake, epoch): 


now — datetime.now() 


now = now.strftime("SY%sm%d $H$M$S") 


# Hacemos que los datos vayan de 0 a 1 
datos Take = (oleo. fake sp il) 7 2.0 


for i in range(10): 
plt.imshow(datos fake[il) 
pilt ezis (torr) 


nemore = SEE exor) T " megen generada V ap SES (ab) ar 
' PRG 

BLUE. 2ك‎ 73 LE (MONEE, BBO Anmene SI EI GME) 

plt.close() 


علاوة على ذلك من المهم “ai‏ حفظ النموذج أثناء تدريبه. يمكن Google Colab J‏ إنهاء 
الجلسات. لذاء إذا لم نحفظ bla‏ الحفظ checkpoints‏ فقد نفقد عملية التدريب بأكملها. 

ومن ناحية أخرى. سوف نقوم بتقييم أداء شبكة التصنيف. وللقيام بذلك. سنقوم بإنشاء بيانات جديدة 
يمكننا من خلالها تقييم النموذج. لماذا لا تستخدم البيانات التي أنشأناها بالفعلفي تلك الدفعة 
التدريبية؟ حسنًا... لأنه من الأفضل التدريب على البيانات الجديدة بدلاً من القيام بذلك باستخدام 
البيانات التي تدرب عليها النموذج للتو. 

Is‏ نظرًا oY‏ هذه الدالة تولد صورًا جديدةء فسنضيف دالة التصور داخل هذه الدالة. 


def evaluar y guardar (modelo generador, epoch, 
medio dataset): 


# We save the model 


now — datetime.now() 

now = now.strftime("$Y$m$d $H$MS$S") 

nombres = عند‎ (epoch). TS SEEMS modelo generador % 
ip oUm 


modelo generador.save (nombre) 
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# We generate new data 

X real, YN real = cergear Caros EEG LES (Ceiceseic, 
medio dataset) 

x Take, Y Fake = 
crear datos fake(modelo generador,medio dataset) 


# We evaluate the model 

_, acc real = modelo discriminador.evaluate(X real, 
Y seall) 

o BOC rake 
Y fake) 


modelo discriminador.evaluate(X fake, 


print CACCE esis! + sex (eee CEA i100) a Ys ACO Bases" ap 
SEE (ACE 122153 LOO) ar z") 


الآن بعد أن أصبح لدينا جميع الدوال التي نحتاجهاء يمكننا إنشاء دالة التدريب: 


def entrenamiento(datos, modelo generador, 

moeloo C1 SEE E RACO, (ejoxexeleusi, im Ol, Imicio = (0) 2 
dimension batch = int(datos.shape[0]/n batch) 
medio dataset - int(n batch/2) 


# We iterate over th pochs 

for sepoch an Eange( IMAGO, inicie t Epoche) s 
# We iterate over all batches 
TOS bearen IM rangen Darten) B 


* We load all the real data 
X real, Y reall = carger datos reales (dataset, 
medio dataset) 


# We train the discriminator withEnrenamos 
discriminador con datos reales 
coste discriminador real, = 
mede EO GA SE EMIRE EAN ON barchi zeal, X reall) 
X rake, Y take = 
crear datos fake(modelo generador,medio dataset) 


coste discriminador fake, _ = 
modelo discriminador.train on batch(X fake, Y fake) 


# We generate input images for the GAN 
X gan = generar datos entrada (medio dataset) 
Y gan = np-.ones(((medio dataset, 1)) 


# We train the GAN with fake data 
coste gan = gan.train on batch(X gan, Y gan) 
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# Every 10 epochs we show the results and cost 
if (epoch*1) $ 10 == 0: 
evaluar y guardar (modelo generador,epoch = epoch, 
medio dataset- medio dataset) 
mostrar imagenes generadas(X fake, epoch epoch) 


مع dia‏ دعونا نرى ما إذا كانت 3&5 GAN‏ تعمل! 


entrenamiento (dataset, modelo generador, 
modelo dascriminader, epochs’ = 300m M bateh=123)7 miero = 0) 


/usr/local/lib/python3.6/dist- 


packages/keras/engine/training.py:297: UserWarning: 
Discrepancy between trainable weights and collected 
trainable weights, did you set '"model.trainable' without 
calling ^model.compile' after ? 

'Discrepancy between trainable weights and collected 
trainable' 


- 0s 2ms/step 
- 0s 225us/step 


- 0s 224us/step 
- 0s 199us/step 


Acc Real:65.625$ Acc Fake:95.3125$ 
== - 0s 247us/step 
- 0s 207us/step 


- 0s 220us/step 
- 0s 200us/step 


Acc Real:76.5625$ Acc Fake:78.125$ 
= - Os 239us/step 
- Os 187us/step 


Acc Real:75.0% Acc Fake:78.125% 


- Os 230us/step 
- 0s 195us/step 


Acc Real:70.3125$ Acc Fake:78.125$ 
- 0s 208us/step 
- 0s 191us/step 


Acc Real:73.4375$ Acc Fake:90.625% 
= - Os 216us/step 
- Os 193us/step 


- Os 247us/step 
- Os 186us/step 


Acc Real:76.5625$ Acc Fake:89.0625$ 
- 0s 236us/step 
- 0s 195us/step 


- 0s 256us/step 
- 0s 202us/step 


- 0s 218us/step 
= - Os 199us/step 
Acc Real:85.9375$ Acc Fake: 96.875% 
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64/64 - 0s 233us/step 
64/64 - 0s 198us/step 
Acc Real:90.625$ Acc Fake:96.875$ 

64/64 - 0s 258us/step 
64/64 - 0s 206us/step 
Acc Real:90.625$ Acc Fake:93.75$ 

64/64 - 0s 277us/step 
64/64 - 0s 230us/step 
Acc Real:95.3125$ Acc Fake:98.4375$ 

64/64 - 0s 251us/step 
64/64 - 0s 194us/step 
Acc Real:98.4375$ Acc Fake:96.875$ 

64/64 [- - 0s 236us/step 
64/64 = - 0s 202us/step 
Acc Real:98.4375$ Acc Fake:96.875$ 

64/64 == - 0s 225us/step 
64/64 = == = - 0s 197us/step 
Acc Real:96.875$ Acc Fake:93.75$ 

64/64 = - 0s 246us/step 
64/64 - 0s 203us/step 
Acc Real:96.875$ Acc Fake:98.4375$ 

64/64 = - 0s 238us/step 
64/64 = = - Os 233us/step 
Acc Real:98.4375$ Acc Fake:100.0$ 

64/64 = - 0s 262us/step 
64/64 = = - Os 208us/step 
Acc Real:95.3125% Acc Fake:100.0% 

64/64 - 0s 310us/step 
64/64 [== = = - 0s 259us/step 
Acc Real:98.4375$ Acc Fake:95.3125$ 

64/64 = - 0s 275us/step 
64/64 - 0s 205us/step 
Acc Real: 

64/64 = - Os 268us/step 
64/64 = - 0s 228us/step 
Acc Real: 

64/64 = - Os 227us/step 
64/64 - 0s 191us/step 
Acc Real: 

64/64 - 0s 276us/step 
64/64 - 0s 212us/step 
Acc Real: 

64/64 - 0s 220us/step 
64/64 - 0s 200us/step 
Acc Real: 

64/64 - 0s 260us/step 
64/64 - 0s 217us/step 
Acc Real: 

64/64 - 0s 207us/step 
64/64 - 0s 207us/step 
Acc Real: 

64/64 - 0s 258us/step 
64/64 - 0s 207us/step 
Acc Real:96.875$ Acc Fake:98.4375$ 


لقد تعلمنا للتو برمجة Python GGAN‏ وقمنا بتدريبها للتو! دعونا نرى كيف هي الصور التي تم 
إنشاوّها! 


X rake, _ = Crear daros tekeln mioestras=49; 
modelo generador-modelo generador) 
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X Tale = (QE Takel 


for i in range(49): 
jolie s Sulsjolloie (7 7 7 7 LEL) 
jolie. )ع ادعقم‎ orr") 
plt.imshow(X fake[i]) 


tae 
te i] 


TIT 
إل اللا‎ | 1 101 1 
LAL 


¥ 


LILILILQq 


إنها تعمل! على الرغم من الدقة المنخفضة (في النهاية. فهي ذات دقة منخفضة Lm‏ قامت شبكتنا 
العصبية بتوليد صور تشبه الطائرات! نعم» صحيح أنه ليست كل الصور تبدو وكأنها طائرات. لو قمنا 
بتدريب الشبكة لمزيد من الفترات لكانت النتائج أفضل. 


على أية SE‏ لقد تعلمت للتو برمجة شبكة Python à GAN‏ والتي تولد صورًا مزيفة ولكن واقعية! 


إذا كنت ترغبفي تدريب هذا النوع من الشبكات باستخدام بيانات أخرى» فدعني أقدم لك بعض 
النصائح. 

4 نصائح لبرمجة شبكة الخصومة التوليدية (GAN)‏ في بايثون 

1. قم بإنشاء نوع واحد من الصور 

في البداية حاولت إنشاء شبكة تولد صورًا مثل تلك الموجودةفي مجموعة بيانات 10 .Cifar‏ ومع ذلك 
فإن هذا يعني أن الشبكة يجب أن تكون قادرة على إنشاء 10 أنواع مختلفة من الصور... وهو أمر معقد 
للغاية. 


لاء إذاكنت ترغبفي تدريب GAIN‏ فإنني أنصحك بالقيام بذلك لشيء واحد فقط. كلاب» طائرات» 
وجوه... كل ما chi‏ ولكن نوع واحد فقط من الصور. 
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2 |3 شم بسرعة jg‏ 8 
في البداية» تركت النماذج تتدرب لمدة تتراوح بين 100 إلى 200 فترة قبل التحقق من LAS‏ عملها. 
مما لا شك فيه أن هذا far‏ عمليات التعلم أبطأ بكثيرء OY‏ تعلم النموذج يستغرق من 10 إلى 20 


دقيقة. 


لذاء إذا كنت تريد إجراء بعض الاختبارات» فإنني أوصي بتدريب النموذج لمدة 20 إلى 30 فترة فقط. 
إذا رأيت أن التغيير الذي قمت بتنفيذه لا يتحسن... أوقف عملية التعلم وجرب شيئًا آخر. 


3. حدد المقياس لتقييم النموذج الخاص بك 
عندما ندرب شبكة عصبية cole‏ يكون من الواضح GLS‏ ما هو المؤشر الذي نحتاج إلى تصوره. ولكن 
ماذا عن GAN؟‏ 


في هذا المنشور. وجدت أفضل المؤشرات التي يجب التحقق منها عند تدريب شبكة GAN‏ وفي 
حالتي استخدمت الدقة مع التركيز على دقة الصور المزيفة. 


4. إذا انتهت الجلسة... قم بتحميل النموذج الخاص بك 

كما أوضحت من قبلء أحد المفاتيح هو حفظ نموذج المولد. ومن خلال القيام eto‏ إذا انتهت 
الجلسةء يمكنك دائمًا تحميل آخر نموذج تم تدريبه واستخدامه لتجنب الاضطرار إلى dole!‏ تدريبه من 
البداية. 


لتحميل النموذج بسيط جدا. يجب عليك: 


1( انتقل إلى مسار Drive‏ الصحيح. 
2( قم بتحميل النموذج باستخدام الدالة Load model‏ 


1 l- We go tO the correct folder in Driva 

from google.colab import drive 

import os 

drive.mount('/content/gdrive/') 

$cd /content/gdrive/MyN Drive/Red \Neuronal \Generativa 
NAntagonica 


# 2. We import the model 
from keras.models import load model 


modelo generador - 
ligadimodeli() 29952 02007225 104051 modelo tgeneradom ys no) 
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/usr/local/lib/python3.6/dist- 
packages/keras/engine/saving.py:341: UserWarning: No 
training configuration found in save file: the model was 
*not* compiled. Compile it manually. 

warnings.warn('No training configuration found in save 
file: 


المصدر: 


https://anderfernandez.com/en/blog/how-to-code-gan-in-python 
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5( توليد الارقام المكتوبة بخط اليد MNIST‏ باستخدام 
شبكات الخصومة التوليدية MNIST Handwritten Digits‏ 


Generation using GANs 

a> 53 هو إطار عمل‎ (Generative Adversarial Network (شبكة الخصومة التوليدية‎ GAN 
2014 إيان جودفيلو ويوشوا بينجيو وآخرونني عام‎ 

يمكن تدريب GAN‏ على إنشاء صور من الضوضاء العشوائية .random noises‏ على سبيل JEI‏ 
يمكننا تدريب GAN‏ على MNIST‏ (مجموعة بيانات الأرقام المكتوبة بخط اليد hand-written‏ 
(digits dataset‏ لإنشاء صور رقمية تبدو وكأنها صور رقمية مكتوبة بخط اليد من «MNIST‏ والتي 
يمكن استخدامها لتدريب الشبكات العصبية الأخرى. 

يعتمد الكود الموجودنىي هذا notebook‏ على مثال TensorFlow GAN MNIST‏ بواسطة 
57 والذي يستخدم 117 ولكننا نستخدم Keras‏ أعلى 01117 لإنشاء 


شبكات أكثر وضوحًا. 


MNIST 


MNIST‏ هي قاعدة بيانات معروفة للأرقام المكتوبة بخط اليد. 


import numpy as np 
import keras 
import keras.backend as K 


from keras.layers import Input, Dense, Activation, 
LeakyReLU, BatchNormalization 

from keras.models import Sequential 

from keras.optimizers import Adam 

Erom Sk LEELA Mocks gelecrion moore brenn ESSE syellaie 
import matplotlib.pyplot as plt 

$matplotlib inline 


Using TensorFlow backend. 
.MNIST أدناه سيتم تنزيل مجموعة بيانات‎ 


(2€ treim, y crain); (QS test, y test) = 

keres- Carasetsommiato LOA elerte) 

دعونا نفحص dye‏ من الصور. نحن نستخدم خريطة "gray" ols Yl‏ لانها لا تحتوي على معلومات 
الألوان. 
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pubs 
for 


OLE 
ois 


— 


figure(figsize-(5, 4)) 

i in range(20): 

o subplot A, 5, ui) 

plt.imshow(X train[i], cmap-'gray') 
OLE seat elis (LI) 


Ole. WELLES ii) 


GME NEVO l) 


show )( 


جميع الصور الرقمية من MNIST‏ تأتي بحجم 28 x‏ 28. 


Semple = X treimi iT] 


Jolie 
jolie c 
joule... 
Jodie 


— 


figure(figsize-(3, 2)) 
title (sample.shape) 
imshow (sample, cmap='gray') 


show () 


(28, 28) 
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X EES MD ()) n 
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)0, 255( 


الحد الأدنى والحد الأقصى لحجم بيانات صورة '2/10115:1 هو 0 و255 على التوالي. 


X train.max() 


المولد 


نريد إنشاء مولد يقوم بإنشاء صور واقعية مكتوبة بخط اليد. 


يطلق على المدخلات إلى المولد اسم "العينة الكامنة "latent sample‏ وهي عبارة عن سلسلة من 
الأرقام التي تم إنشاؤها عشوائيًا. نحن نستخدم التوزيع الطبيعي بدلا من التوزيع المنتظم. 


def make latent samples(n samples, 
#return np.random.uniform(-1, 


sample size)) 


sample size)) 


حجم العينة sample siz‏ هو معلمة فائقة «Us .hyperparameter‏ نستخدم متجهًا مكونًا من 100 


make latent Samples (i; 


array([[ 0. 


fully 


0 
0. 

-0 
1 
al 
0 
0 

-0 


1 
mal 
-0 
-0 
-0 

0 
-0 
-0 

0 
mal 

1 


27473292, -0 
.26621725, -0 
6695888 , 0 
.01707456, 0 
.12131043, -1 
18045669, -0 
.1179318 , -0 
.80441626, -0 
.00255198, 1 
.09418122, -0 
.40058816, -0 
.23835781, -0 


.97779726, 1 
.27751868, 0 
.99746905, 
.40399178, 0 
.15437594, 0 
.68991131, 1 
.13489859, 
.00938931, 0 


المولد generator‏ عبارة عن شبكة عصبية بسيطة متصلة بالكامل connected neural‏ 


-0 


return np.random.normal (loc=0, 


100) 


.10655303, 1 


.01077858, 1 
- 93482157, -1 
.37335705, 0 
.66056623, -0 
.33343053, 0 
.91808507, -1 
.01966988, -0 
.01100422, 0 
.90881511, -0 
.16028498, -1 
.35751269, -0 
. 76487061, -0 
. 71869572, -1 
.00786507, -0 
.35693832, -1 
.12191884, -0 


.85151145, 1 
.59428163, 0 
.06230197, 


s 


.09659154, 
.90989847, 
.00884217, 
.33970841, 1 
.01493777, 0 
.60287437, 0 
.03957979, 0 
. 79409032, 1 
.56261678, -0 
.19342759, 0 
. 86537691, 0 
.97823372, 1 
0 
0 
1 
0 
1 
0 
1 
0 


1, 


# generates 


0- 
باو 
0- 


. 33914689, - 
.22436248, 

.66620361, - 
.45288997, - 
.00680743, - 
.05853026, - 
.4483107 , - 
. 74878905, 


scale-1, 


sample size): 
size-(n samples, 


size-(n samples, 


رقم تم إنشاؤه عشوائيًا كعينة. 


one sample 


.15366093, -0. 
.18569009, -0 
.29230866, -1 
.37859658, -0 
.808652 , -0 
.9825658 , -0 
.40643158, -0 
.55127879, 0 
.39284342, -0 
.3317994 , 0 
.6165322 , -0 
.26912872, -1 
.57437618, 0 
.7134086 , -1 
.40849483, -0 
.79326825, -0 
.30782153, 0 
.4318387 , -0 
.07967249, -0 
.13811637, -0 


61587259, 


.03249574, 
.13929507, 
.53026397, 
.36080177, 
.31889656, 
.32754068, 
.34457065, 
.03217389, 
.19549762, 
.4672151 , 
.29290883, 
.86655979, 
.1244994 , 
.26476278, 
. 48003003, 
.45268918, 
.19847975, 
.02395855, 
.4902213 ]1) 


network‏ بطبقة مخفية hidden layer‏ واحدة مع تنشيط leaky ReLU‏ يأخذ عينة كامنة واحدة 
(100 قيمة) وينتج 784 (- 28 28) نقطة بيانات تمثل صورة رقمية. 


generator = 


Sequential([ 
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Dense(128, input shape-(100,)), 
LeakyReLU(alpha-0.01), 
Dense(784), 
Activation('tanh') 

], name='generator') 


generator.summary () 


Layer (type) Output Shape Param# - 
dense 1 (Dense) (None, 128) 12928  — 
leaky re lu 1 (LeakyReLU) (None, 128) 0 
dense 2 (Dense) (None, 784 101136 0 
activation 1 (Activation) (None, 784) 0 


Total params: 114,064 
Trainable params: 114,064 
Non-trainable params: 0 


التنشيط الأخير هو tanh‏ وهذا يعنى أيضًا أننا بحاجة إلى isle]‏ قياس صور MNIST‏ لتكون بين -1 
و1. 


في البدايةء يمكن للمولد إنتاج القمامة فقط. 


على هذا النحو. يحتاج المولد إلى تعلم كيفية إنشاء صور واقعية مكتوبة بخط اليد من العينة الكامنة 
(الأرقام التي يتم إنشاؤها عشوائيًا). 


كيفية تدريب هذا المولد؟ هذا هو السؤال الذي تناولته GAN‏ 
قبل الحديث عن GAN‏ سنناقش المميز -discriminator‏ 


المميز 


يأخذ discriminator jJ!‏ صورة رقمية ويصنف ما إذا كانت الصورة حقيقية )1( el‏ لا (0). 


إذا كانت الصورة المدخلة من قاعدة بيانات (MNIST‏ فيجب على المميّز تصنيفها على أنها حقيقية 
.real‏ 


إذا كانت الصورة المدخلة من المولدء فيجب على المُميز تصنيفها على أنها مزيفة fake‏ 


leaky ReLU عبارة عن شبكة عصبية بسيطة متصلة بالكامل بطبقة واحدة مخفية مع تنشيط‎ radi 
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discriminator = Sequential ([ 
Dense(128, input shape-(784,)), 
LeakyReLU(alpha-0.01), 
Dense(1), 
Activation('sigmoid') 

J], name='discriminator') 


discriminator.summary () 


Layer (type) Output Shape ^ Param $& — 
dense 3 (Dense) (None, 128) 100480 
leaky re lu 2 (LeakyReLU) (None, 128) 0 

dense 4 (Dense) (None, 1) 129 
activation 2 (Activation) (None, 1) 0 


Total params: 100,609 
Trainable params: 100,609 
Non-trainable params: 0 


التنشيط الأخير هو sigmoid‏ ليخبرنا باحتمالية ما إذا كانت الصورة المدخلة حقيقية أم لا. 
نقوم بتدريب eI‏ باستخدام كل من صور MNIST‏ والصور التي تم إنشاؤها بواسطة المولد. 


GAN 

نقوم بتوصيل المولد والمميز لإنتاج GAN‏ 

يأخذ العينة الكامنةء وينتج المولد الموجود داخل GAN‏ صورة رقمية يصنفها jal‏ داخل GAN‏ 
على أنها حقيقية أو مزيفة. 

إذا كانت الصورة الرقمية التي تم إنشاؤها واقعية dm‏ فإن المُميزني GAN‏ يصنفها على أنها حقيقية 


وهو ما نريد تحقيقه. 


لقد قمنا بتعيين Keal‏ داخل GAN‏ غير قابلة للتدريب cnot-trainable‏ لذا فهي تقوم فقط بتقييم 
جودة الصورة التي تم إنشاؤها. تكون التسمية دائمًا 1 (حقيقي) بحيث إذا فشل المولدفي إنتاج صورة 
رقمية واقعيةء تصبح تكلفتها مرتفعة» وعندما يحدث الانتشار الخلفيفي GAN‏ يتم تحديث الأوزان 
في شبكة المولد. 
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# maintain the same shared weights with the generator and 
the discriminator. 
gan = Sequential ([ 

CESK err y, 

discriminator 


1) 


gan.summary() 


Layer (type) Output Shape Param # 
generator (Sequential) (None, 784) 114064 
discriminator (Sequential) (None, 1) 100609 


Total params: 214,673 
Trainable params: 214,673 
Non-trainable params: 0 


كما ترون» تستخدم GAN‏ داخليًا نفس نماذج المولد والمميز. تحتفظ GAN‏ بنفس الأوزان المشتركة 
مع المولد والمميز. UY‏ فإن تدريب GAN‏ يعمل Call‏ على تدريب المولد. ومع ذلك» لا نريد أن 
يتأثر المُميّر أثناء تدريب .GAN‏ 

نقوم بتدريب المميّز GAN;‏ بدورهم ونكرر التدريب عدة مرات حتى يتم تدريبهما جيداً. 

أثناء تدريب «GAN‏ يجب أن يقوم الانتشار الخلفي بتحديث أوزان المولد وليس المميّز. 


على هذا النحو. نحن بحاجة إلى طريقة لجعل SUB sell‏ للتدريب وغير قابل للتدريب. 


def make trainable (model, trainable): 
for layer in model.layers: 
layer.trainable - trainable 


make trainable(discriminator, False) 
discriminator.summary () 


Layer (type) Output Shape Param # 
dense 3 (Dense) (None, 128) moomo Û 
leaky re lu 2 (LeakyReLU) (None, 128) 0 

dense 4 (Dense) (None, 1) 129 
activation 2 (Activation) (None, 1) 0 


Total params: 100,609 
Trainable params: 0 
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Non-trainable params: 100,609 


make trainable(discriminator, True) 
discriminator.summary () 


Layer (type = Output Shape Parm# 
A a ensa LEES 
dense 4 (Dense) (None, 1)  . 129 


Total params: 100,609 
Trainable params: 100,609 
Non-trainable params: 0 


تجمع الدالة أدنامكل ما ناقشناه حتى الآن لبناء نماذج المولد والمميز GAN‏ وتجميعها أيضًا للتدريب. 


def make simple GAN(sample size, 
G Rudden Sze, 
GL MICOS Sune, 
leaky alpha, 
g learning rate, 
d learning rate): 
eo وت له‎ session) 


generator = Sequential ( [ 
Dense(g hidden size, input shape-(sample size,)), 
LeakyReLU(alpha-leaky alpha), 
Dense(784), 
diee atre alat KESR V )) 
], name='generator') 


discriminator - Sequential([ 
Dense(d hidden size, input shape-(784,)), 
LeakyReLU(alpha-leaky alpha), 
Dense(1), 
Activation('sigmoid') 
J], name='discriminator') 


gan = Sequential ([ 
generator, 
discriminator 


1) 
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discriminator.compile(optimizer-Adam(lr-d learning rate), 
loss-'binary crossentropy') 

gan.compile(optimizer-Adam(lr-g learning rate), 
loss-'binary crossentropy') 


return gan, generator, discriminator 


GAN cu Ja 


المعالجة المسبقة 
نحن بحاجة إلى تسطيح flatten‏ بيانات الصورة الرقمية حيث تتوقع طبقة الإدخال المتصلة بالكامل 
ذلك. (aol‏ نظرًا OY‏ المولد يستخدم تنشيط Gtanh‏ طبقة الإخراج» فإننا نقوم بقياس جميع صور 
MNIST‏ للحصول على ed‏ تتراوح بين -1 do‏ 


def preprocess (x): 
x = x.reshape(-1, 784) # 784-28*28 
x = np.float64 (x) 
me (e / 255 = (s) s 2 
x = MOO CLO, =i, db) 
return x 


Ean reell = Prep oOCseS (oe ecem) 
X test real = EEOC O test) 


إزالة المعالجة 
نحتاج Cal‏ إلى دالة لعكس المعالجة المسبقة حتى نتمكن من عرض الصور التي تم إنشاؤها. 


def deprocess (x): 
xe = (se f 2 7 d) = 255 
s = ajo. CLO, 0. 2595) 
x np.urntS9(x) 
x — x.reshape(28, 28) 
return x 


plt.figure(figsize-(5, 4)) 

for i in range(20): 
img = deprocess(X train real[i]) 
olre- srioplor (4, y. atari) 
plt.imshow(img, cmap='gray') 
jolie soe ste ss (| |) 
لات‎ 57752125 (ID 

plt.tight layout () 

plt.show () 
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Bi EJ لكا‎ FA kû 
AUT Ty 
EH E BUD 


التسميات labels‏ هي 1 (حقيقية sl (real‏ 0 (مزيفة gis JS (fake‏ الأبعاد. 


def make labels(size): 
return np.ones([size, 1]), np.zeros([size, 1]) 


فيما يلي 10 مجموعات من قيم التسميات الحقيقية والمزيفة. 


y reall l0, y take 10 = make labels’ (il) 


y real 10, y fake 10 


(array([I 


dn‏ يم c‏ يم يم يم يم يم يم يم يسم يم يم يم يم يسم سم س 


peN 


OOoOoooooocomnmmnbmnpbmbmpifnHdbpwHiHimHd 


1 
1 
1 
ils 
1, 
2 m. 
Ts 
1 
I 
11), array([[ 0.1, 
1 
I 
1 
Is 
zd 
17 
I 
1 
11 


112) 
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تنعيم التسميات 

نقطة أخيرة قبل أن نبداً التدريب هي تنعيم التسمية label smoothing‏ مما يجعل المميز يعمم بشكل 
أفضل. 

بالنسبة للصور الرقمية الحقيقيةء تكون التسميات كلها بالرقم 1. ومع AUS‏ عندما ندرب أداة المميزء 
نستخدم قيمة أصغر SU‏ من 1 مع الصور الرقمية الحقيقية. وبخلاف ذلك قد يبالغ I‏ بيانات 
التدريب ويرفض أي شيء آخر يختلف Sel‏ عن صور التدريب. 


حلقة التدريب 
نكرر ما يلي لجعل كل من المميز والمولد أفضل وأفضل: 


فد sedi‏ تن الق اة 

e‏ إعداد مجموعة من الصور المزيفة التي تم إنشاؤها بواسطة المولد باستخدام العينات الكامنة. 
RAS Sonia c‏ قريب 

O‏ تدريب المميز على تصنيف الصور الحقيقية والمزيفة. 

ف UG ge adl la.‏ اريت 

GAN تدريب المولد عبر‎ e 


عند تدريب المولد عبر GAN‏ تكون التسميات المتوقعة كلها 1 (حقيقية).في البدايةء لا ينتج المولد 
صورًا واقعية da‏ لذا يصنفها etl‏ على أنها 0 (زائفة)؛ مما يتسببفي قيام الانتشار الخلفي بضبط 
الأوزان داخل المولد. لا يتأثر المُميّز LY‏ جعلناه غير قابل للتدريبفي هذه الخطوة. 


# hyperparameters 


sample size = 100 f latent samole suis (1.55, 100 
random numbers) 

G 0 Sitze = 128 

(GL 1 S1276 = 12% 

leaky alpha = 0.01 

g leerming rate = 0.0001 f learning rate EOE the generator 
Gl LEER carce = 0,001 # learning rate for the 
discriminator 

epochs = 100 

barch Size = 64 i creua لات عت‎ size 

eval size = l6 f evaluate size 

smooth = 0,1 


i déloeils EOE the batch size End the test s126 
y EZEM zeal, y train take = maks lebels (barch size) 
y eval real, y eval ralk = make labels(eval size) 


# create a GAN, a generator and a discriminator 
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gan, generator, discriminator = make simple GAN( 
sample size, 
(ej Midden SIZE, 
el Miciden S126; 
leaky alpha, 
g_ learning rate, 
el dleerminge sete) 


losses = [] 
for e in range (epochs): 
for i in range(len(X train real)//batch size): 
f real MNIST digit images 
X baren treal = 
X erein reell lisbarcch S1263 Girl) ~ bacen size] 


# latent samples and the generated digit images 

latent samples = make latent samples(batch size, 
sample size) 

X barch trake = 
generator.predict on batch(latent samples) 


# train the discriminator to detect real and fake 
images 


make trainable(discriminator, True) 

discriminator.train on batch(X batch real, 
y erein ceall + (UL = SOOM) 

discriminator.train on batch(X batch fake, 
y train fake) 


# train the generator via GAN 
make trainable(discriminator, False) 
gan.train on batch(latent samples, y train real) 


f evaluate 

X eval real = 
X exse Seul |] سم اموه عدن هزه‎ Choice (lem (o restr real); Ewell Saws, 
replace-False)] 


latent samples = make latent samples(eval size, 
sample size) 
X eval fake = generator.predict on batch(latent samples) 


Gl less = Cigcriminaror test om barch eval rsal, 
y eval reel) 

logs = ChigCriminator cect OM bacchi eval Teker‏ لم 
y eval fake)‏ 

g loss = gan test on barch latent samples, y eval reell) 
# we want the fake to be realistic! 


liosises append (C loss, € LOSS) 
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DEANE (Vinjorexcians 1: I11) BDiSCERIMINAEOS LOSS: (O AEF} 
Generator Loss: {:>6.4f}".format ( 
aril, (jocis, 6 logs, c loss) ) 


Epoch: 1/100 Discriminator Loss: 0.9538 Generator Loss: 5.5816 
Epoch: 2/100 Discriminator Loss: 0.1899 Generator Loss: 2.1410 
Epoch: 3/100 Discriminator Loss: 0.3655 Generator Loss: 1.4118 
Epoch: 4/100 Discriminator Loss: 0.1344 Generator Loss: 3.0701 
Epoch: 5/100 Discriminator Loss: 0.3473 Generator Loss: 2.3738 
Epoch: 6/100 Discriminator Loss: 0.5153 Generator Loss: 3.7222 
Epoch: 7/100 Discriminator Loss: 0.5159 Generator Loss: 3.5699 
Epoch: 8/100 Discriminator Loss: 0.7343 Generator Loss: 2.1149 
Epoch: 9/100 Discriminator Loss: 0.4661 Generator Loss: 2.3607 
Epoch: 10/100 Discriminator Loss: 0.2888 Generator Loss: 2.4522 
Epoch: 11/100 Discriminator Loss: 0.4095 Generator Loss: 1.5612 
Epoch: 12/100 Discriminator Loss: 0.5406 Generator Loss: 2.7845 
Epoch: 13/100 Discriminator Loss: 0.3287 Generator Loss: 2.6246 
Epoch: 14/100 Discriminator Loss: 0.2806 Generator Loss: 2.9350 
Epoch: 15/100 Discriminator Loss: 0.6982 Generator Loss: 3.5069 
Epoch: 16/100 Discriminator Loss: 0.4339 Generator Loss: 3.3039 
Epoch: 17/100 Discriminator Loss: 0.7092 Generator Loss: 1.9226 
Epoch: 18/100 Discriminator Loss: 0.8024 Generator Loss: 4.9868 
Epoch: 19/100 Discriminator Loss: 0.2961 Generator Loss: 2.8417 
Epoch: 20/100 Discriminator Loss: 0.5851 Generator Loss: 3.4906 
Epoch: 21/100 Discriminator Loss: 0.3387 Generator Loss: 1.9244 
Epoch: 22/100 Discriminator Loss: 0.4378 Generator Loss: 3.1012 
Epoch: 23/100 Discriminator Loss: 0.2871 Generator Loss: 2.0432 
Epoch: 24/100 Discriminator Loss: 0.3734 Generator Loss: 2.6555 
Epoch: 25/100 Discriminator Loss: 0.7119 Generator Loss: 2.8028 
Epoch: 26/100 Discriminator Loss: 0.1978 Generator Loss: 2.8457 
Epoch: 27/100 Discriminator Loss: 0.5232 Generator Loss: 2.5416 
Epoch: 28/100 Discriminator Loss: 0.2756 Generator Loss: 2.2270 
Epoch: 29/100 Discriminator Loss: 0.3289 Generator Loss: 3.0124 
Epoch: 30/100 Discriminator Loss: 0.5604 Generator Loss: 3.3040 
Epoch: 31/100 Discriminator Loss: 0.8915 Generator Loss: 3.2336 
Epoch: 32/100 Discriminator Loss: 0.6021 Generator Loss: 1.9195 
Epoch: 33/100 Discriminator Loss: 0.4144 Generator Loss: 3.0869 
Epoch: 34/100 Discriminator Loss: 0.6223 Generator Loss: 2.1233 
Epoch: 35/100 Discriminator Loss: 0.2667 Generator Loss: 2.5386 
Epoch: 36/100 Discriminator Loss: 0.3951 Generator Loss: 2.5837 
Epoch: 37/100 Discriminator Loss: 0.6367 Generator Loss: 2.4578 
Epoch: 38/100 Discriminator Loss: 0.4050 Generator Loss: 2.6965 
Epoch: 39/100 Discriminator Loss: 0.3699 Generator Loss: 2.7588 
Epoch: 40/100 Discriminator Loss: 0.6437 Generator Loss: 2.1038 
Epoch: 41/100 Discriminator Loss: 0.2477 Generator Loss: 3.1998 
Epoch: 42/100 Discriminator Loss: 0.3357 Generator Loss: 3.3893 
Epoch: 43/100 Discriminator Loss: 0.8104 Generator Loss: 2.9031 
Epoch: 44/100 Discriminator Loss: 0.5600 Generator Loss: 3.6187 
Epoch: 45/100 Discriminator Loss: 0.4684 Generator Loss: 2.3988 
Epoch: 46/100 Discriminator Loss: 0.2899 Generator Loss: 3.8236 
Epoch: 47/100 Discriminator Loss: 0.2372 Generator Loss: 3.9306 
Epoch: 48/100 Discriminator Loss: 0.5744 Generator Loss: 2.6210 
Epoch: 49/100 Discriminator Loss: 0.5644 Generator Loss: 2.2713 
Epoch: 50/100 Discriminator Loss: 0.9803 Generator Loss: 2.6462 
Epoch: 51/100 Discriminator Loss: 0.5349 Generator Loss: 3.0719 
Epoch: 52/100 Discriminator Loss: 0.8361 Generator Loss: 3.4607 
Epoch: 53/100 Discriminator Loss: 0.4824 Generator Loss: 3.0189 
Epoch: 54/100 Discriminator Loss: 0.6155 Generator Loss: 2.7298 
Epoch: 55/100 Discriminator Loss: 0.6074 Generator Loss: 2.4785 
Epoch: 56/100 Discriminator Loss: 0.6182 Generator Loss: 2.7999 
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Epoch: 57/100 Discriminator Loss: 0.8172 Generator Loss: 2.2989 
Epoch: 58/100 Discriminator Loss: 0.6180 Generator Loss: 3.2786 
Epoch: 59/100 Discriminator Loss: 0.8217 Generator Loss: 3.1931 
Epoch: 60/100 Discriminator Loss: 0.6151 Generator Loss: 3.0382 
Epoch: 61/100 Discriminator Loss: 0.8208 Generator Loss: 3.2423 
Epoch: 62/100 Discriminator Loss: 0.7167 Generator Loss: 2.0826 
Epoch: 63/100 Discriminator Loss: 0.7112 Generator Loss: 2.6495 
Epoch: 64/100 Discriminator Loss: 0.5140 Generator Loss: 2.6749 
Epoch: 65/100 Discriminator Loss: 0.8169 Generator Loss: 2.7637 
Epoch: 66/100 Discriminator Loss: 0.5278 Generator Loss: 2.1983 
Epoch: 67/100 Discriminator Loss: 0.7610 Generator Loss: 3.1669 
Epoch: 68/100 Discriminator Loss: 0.5442 Generator Loss: 2.8738 
Epoch: 69/100 Discriminator Loss: 0.8466 Generator Loss: 2.0486 
Epoch: 70/100 Discriminator Loss: 0.6251 Generator Loss: 2.2485 
Epoch: 71/100 Discriminator Loss: 0.6418 Generator Loss: 2.2814 
Epoch: 72/100 Discriminator Loss: 0.4677 Generator Loss: 2.2908 
Epoch: 73/100 Discriminator Loss: 0.6132 Generator Loss: 2.8723 
Epoch: 74/100 Discriminator Loss: 0.7114 Generator Loss: 2.6701 
Epoch: 75/100 Discriminator Loss: 1.0905 Generator Loss: 1.9237 
Epoch: 76/100 Discriminator Loss: 0.9982 Generator Loss: 2.5257 
Epoch: 77/100 Discriminator Loss: 0.7214 Generator Loss: 2.1899 
Epoch: 78/100 Discriminator Loss: 0.7138 Generator Loss: 1.9392 
Epoch: 79/100 Discriminator Loss: 0.9038 Generator Loss: 2.3197 
Epoch: 80/100 Discriminator Loss: 1.0450 Generator Loss: 3.0043 
Epoch: 81/100 Discriminator Loss: 0.5381 Generator Loss: 2.9071 
Epoch: 82/100 Discriminator Loss: 0.5621 Generator Loss: 2.5895 
Epoch: 83/100 Discriminator Loss: 0.8544 Generator Loss: 3.3824 
Epoch: 84/100 Discriminator Loss: 0.8167 Generator Loss: 2.6601 
Epoch: 85/100 Discriminator Loss: 0.7621 Generator Loss: 2.9904 
Epoch: 86/100 Discriminator Loss: 0.8123 Generator Loss: 2.7157 
Epoch: 87/100 Discriminator Loss: 0.5252 Generator Loss: 3.1781 
Epoch: 88/100 Discriminator Loss: 0.9563 Generator Loss: 2.1756 
Epoch: 89/100 Discriminator Loss: 1.0338 Generator Loss: 2.7354 
Epoch: 90/100 Discriminator Loss: 0.5451 Generator Loss: 3.0826 
Epoch: 91/100 Discriminator Loss: 0.9634 Generator Loss: 3.0830 
Epoch: 92/100 Discriminator Loss: 0.7814 Generator Loss: 2.9515 
Epoch: 93/100 Discriminator Loss: 0.8324 Generator Loss: 3.5539 
Epoch: 94/100 Discriminator Loss: 1.8759 Generator Loss: 1.9687 
Epoch: 95/100 Discriminator Loss: 0.9151 Generator Loss: 2.2101 
Epoch: 96/100 Discriminator Loss: 0.9279 Generator Loss: 2.2720 
Epoch: 97/100 Discriminator Loss: 0.8894 Generator Loss: 3.2808 
Epoch: 98/100 Discriminator Loss: 0.9052 Generator Loss: 2.5838 
Epoch: 99/100 Discriminator Loss: 0.6043 Generator Loss: 2.9611 
Epoch: 100/100 Discriminator Loss: 0.5693 Generator Loss: 2.3100 
GAN استقرار‎ 


وكما تبين» فإن تدريب GAN‏ أمر صعب EU‏ وهناك العديد من الحيل والاستدلالات المطلوبة. 
وذلك oY‏ المّميز والمولد لا يتعاونان ويتعلمان بشكل فردي التنبؤ بشكل أفضل. 

على سبيل المثال» قد يتعلم المولد خداع المميز بالقمامة. من الناحية المثالية» يجب أن يتعلم Byers)‏ 
وقت أبكر من المولد حتى يتمكن من تصنيف الصور بدقة. 


AU‏ استخدمت معدلات تعلم مختلفة للمولد والمميز. كنت أرغبفي إبطاء تعلم المولد حتى يتعلم 
المُميّز التصنيف جيداً. 
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لست las ea‏ بنسبة 96100 مما إذا كانت هذه استراتيجية جيدة للاستخدام بشكل عام ولكن يبدو أنها 

ناجحةفي هذا المشروع. 

كلما تعلم المولد أكثر وتناقص الخطأ. زاد خطأ المُميّز. أرى نوعًا من التوازن حوالي 90-80 فترة. 
losses = np.array(losses)‏ 


riep ax = PIE. 5224553 (O) 
plt.plot(losses.T[0], label='Discriminator') 
plt.plot(losses.T[1], label='Generator') 
plt.title("Training Losses") 

plt.legend() 

plt.show() 


Training Losses 


— Discriminator 
— Generator 


100 80 60 40 20 0 
اختبار المولد 
نقوم الآن بإنشاء بعض الصور الرقمية باستخدام المولد المدرب. 


latent samples - make latent samples(20, sample size) 
Generewecl cheilte = genendtonspnmecdc aient Sell oles) 


plt.figure(figsize-(10, 8)) 

for i in range(20): 
img = deprocess (generated digits[i]) 
joli subplot (4, 5p sib) 
plt.imshow(img, cmap='gray') 
plr xcriecks (O 
alres ELE KES (IET) 

plt.tight layout () 

plt.show () 
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5]توليد الصور باستخدام شبكات الخصومة التوليدية 


https: 


HEHEHE 
227 
FAVA FIFE 
HEBEL 


المصدر: 


notebook.community/naokishibuya/deep-learnin thon/gan mnist 
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6( إنشاء jga‏ الموضة باستخدام شبكات الخصومة 
التوليدية Fashion Image Generation using GANs‏ 

سوف تستكشف هذه المقالة Generative Adversarial Networks (GAINs)‏ وقدرتها الرائعة 
على توليد صور الموضة fashion image generation‏ لقد أحدثت شبكات GAN‏ 85 مجال 
النمذجة التوليدية «generative modeling‏ حيث تقدم نهجًا مبتكرًا لإنشاء محتوى جديد من خلال 
التعلم التنافسي „adversarial learning‏ 


خلال هذا الدليل» ستأخذكفي رحلة آسرةء بدءًا من المفاهيم الأساسية لشبكات GAN‏ والتعمق تدريجيًا 
في تعقيدات إنشاء صور الموضة. من خلال المشاريع العملية والتعليمات خطوة بخطوة سنرشدك 
خلال ely‏ نموذج GAN‏ الخاص بك وتدريبه باستخدام .Keras; TensorFlow‏ 


استعد لإطلاق العنان لإمكانات شبكات GAN‏ وشاهد سحر الذكاء الاصطناعيني عالم الموضة. سواء 
كنت ممارسًا متمرسّافي مجال الذكاء الاصطناعي أو متحمسًا للفضول» ستزودك GANS in ' ijs»‏ 
"Vogue‏ بالمهارات والمعرفة اللازمة لإنشاء تصميمات أزياء مذهلة ودفع حدود الفن التوليدي. دعونا 
نتعمقفي عالم شبكات GAN‏ الرائعة ونطلق العنان للإبداع بداخلها! 
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فهم شبكات الخصومة التوليدية (GANSs)‏ 

ماهي شبكات *GAN‏ 

تتكون شبكات الخصومة التوليدية (GANS)‏ من شبكتين عصبيتين: generator JJ Jl‏ والمميز 
«discriminator‏ المولد مسؤول عن إنشاء عينات بيانات جديدة بينما مهمة المميز هي التمبيز بين 
البيانات الحقيقية real data‏ والبيانات المزيفة fake data‏ التي يولدها المولد. يتم تدريب الشبكتين 
في وقت واحد من خلال عملية تنافسية «competitive process‏ حيث يقوم المولد بتحسين قدرته 


على إنشاء عينات واقعية بينما يصبح المميز أفضلفي التعرف على الحقيقي من المزيف. 


كيف تعمل شبكات CGAN‏ 

تعتمد شبكات GAN‏ على سيناريو يشبه اللعبة حيث يلعب المولد والمميز ضد بعضهما البعض. 
يحاول المولد إنشاء بيانات تشبه البيانات الحقيقية» بينما يهدف المميز إلى التمييز بين البيانات 
الحقيقية والمزيفة. يتعلم المولد كيفية إنشاء عينات أكثر واقعية من خلال عملية التدريب العدائية 


adversarial training process‏ هذه. 


المكونات الرئيسية لشبكات GAN‏ 
لبناء شبكة «GAN‏ نحتاج إلى عدة مكونات facial‏ 


:GeneratoraJgoJl e‏ شبكة dues‏ تولد ole‏ بيانات جديدة. 

e‏ المميز :Discriminator‏ شبكة عصبية تصنف البيانات على أنها حقيقية أو مزيفة. 

o‏ المساحة الكامنة :Latent Space‏ مساحة متجهة عشوائية يستخدمها المولد كمدخل 
لإنتاج العينات. 

o‏ حلقة التدريب :Training Loop‏ العملية التكرارية لتدريب المولد والمميزفي خطوات 
متناوية. 


GAN الخطأ في شبكات‎ Jiga 

تعتمد Xe‏ تدريب GAN‏ على دوال خطأ loss functions‏ محددة. يحاول المولد تقليل خطاً 
المولد. مما يشجعه على إنشاء بيانات أكثر واقعية. في الوقت نفسه. يهدف المميّز إلى تقليل خطأ المميّن 
ليصبح أفضلفي التمييز بين البيانات الحقيقية والمزيفة. 
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نظرة عامة على المشروع: إنشاء صور الموضة باستخدام شبكات GAN‏ 
هدف المشروع 

في هذا المشروع» Gag‏ إلى GAN ely‏ لإنشاء صور أزياء جديدة تشبه تلك الموجودةفي مجموعة 
-Fashion MNIST bl,‏ يجب أن تلتقط الصور التي تم إنشاؤها السمات الأساسية لمختلف 
pole‏ الموضة؛ مثل الفساتين والقمصان والسراويل والأحذية. 


مجموعة البيانات: Fashion MNIST‏ 
سوف نستخدم مجموعة بيانات «Fashion MNIST‏ وهي مجموعة بيانات مرجعية شائعة تحتوي 
على صور ذات تدرج رمادي لعناصر الموضة. تبلغ أبعاد كل صورة 28 28 بكسلء وهناك عشر US‏ 

في المجمل. 

تهيئة بيثة المشروع 

ca‏ يجب علينا إعداد بيئة Python‏ الخاصة بنا وتثبيت المكتبات اللازمة. Gly‏ ذلك 
TensorFlow Datasets, Matplotlib» TensorFlow‏ . 
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بناء شبكة GAN‏ 


استيراد التبعيات والبيانات 


التي تحتوي على مجموعة من صور الموضة. سوف نستخدم مجموعة البيانات هذه لتدريب نموذج 
الذكاء الاصطناعى الخاص بنا لإنشاء صور أزياء جديدة. 


# Install required packages (only need to do this once) 
‘pip install tensorflow tensorflow-gpu matplotlib 
tensorflow-datasets ipywidgets 

Voto Ligt 


# Import necessary libraries 

import tensorflow as tf 

from tensorflow.keras.models import Sequential 

from tensorflow.keras.layers import Conv2D, Dense, Flatten, 
Reshape, LeakyReLU, Dropout, UpSampling2D 

import tensorflow datasets as tfds 

from matplotlib import pyplot as plt 


# Configure TensorFlow to use GPU for faster computation 

goug = iis CONTIG OEE imental LSE Tele ceyices (OBUS) 

ror Gou imn 1 
tf.config.experimental.set memory growth(gpu, True) 


# Load the Fashion MNIST dataset 
Gs = TICS. LOSE (Vireisiasloim MISE; Splir= rrain") 
تصور البيانات وبناء مجموعة البيانات‎ 
وإعداد مسار‎ Fashion MNIST بعد ذلك سنقوم بتصور عينة من الصور من مجموعة بيانات‎ 
وإنشاء مجموعات من الصور‎ data transformations البيانات. سنقوم بإجراء تحويلات للبيانات‎ 
.GAN لتدريب شبكة‎ 


# Data Transformation: Scale and Vizualize Images 
import numpy as np 


# Setup data iterator 
daas EEA EOE = deas MUNRO ECE AE OE) 


# Visualize some images from the dataset 
fig, ax = plt.subplots(ncols-4, figsize-(20, 20)) 


# Loop four times and get images 

iek im EMCO RA) s‏ روط 

# Grab an image and its label 
sample = dataiterator.next() 
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image = np.squeeze(sample['image']) # Remove the 
single-dimensional entries 
label = sample['label'] 


# Plot the image using a specific subplot 
ax[idx].imshow(image) 
عمق‎ TOS o Ciele sert Tert (Levee) 


# Data Preprocessing: Scale and Batch the Images 

def scale images (data): 
f Scale the pixel values of the images between 0 and 1 
image = data['image'] 
return image / 255.0 


# Reload the dataset 
Gls) = TICS. LOSE (TASES MISE; Solir= rrem") 


i Apply the scale images preprocessing step to the dataset 
ds = ds.map(scale images) 


# Cache the dataset for faster processing during training 
ele = CS. (اعطعوهة‎ 


# Shuffle the dataset to add randomness to the training 
process 
ds = ds.shuffle(60000) 


# Batch the dataset into smaller groups (128 images per 
batch) 
ds = ds.batch (128) 


# Prefetch the dataset to improve performance during 
training 
ds = ds.prefetch (64) 


# Check the shape of a batch of images 

ds.as numpy iterator().next().shape 

في هذه الخطوة. نقوم Nl‏ بتصور أربع صور أزياء عشوائية من مجموعة البيانات باستخدام مكتبة 

.matplotlib‏ يساعدنا هذا على فهم شكل الصور وما نريد أن يتعلمه نموذج الذكاء الاصطناعي الخاص 
بنا. 


بعد تصور الصورء. ننتقل إلى المعالجة المسبقة للبيانات data preprocessing‏ نقوم بقياس قيم 
البكسل للصور بين 0 ody‏ مما يساعد نموذج الذكاء الاصطناعي على التعلم بشكل أفضل. تخيل أن 
تقوم بتحجيم scaling‏ سطوع الصور لتكون مناسبة للتعلم. 
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بعد ANS‏ نقوم بتجميع الصورفي مجموعات مكونة من 128 صورة (دفعة (batch‏ لتدريب نموذج 
الذكاء الاصطناعي الخاص بنا. GSS‏ الدفعات على أنها تقسيم مهمة كبيرة إلى أجزاء أصغر يمكن 
التحكم فيها. 

نقوم Lal‏ بتبديل مجموعة البيانات Blois‏ لإضافة بعض العشوائية حتى لا يتعرف نموذج الذكاء 
الاصطناعي على الصور بترتيب ثابت. 

وأخيرًاء نقوم بإحضار البيانات مسبقًا لإعدادها لعملية التعلم الخاصة بنموذج الذكاء الاصطناعي؛ مما 
يجعلها تعمل بشكل أسرع وأكثر كفاءة. 


2 4 , e 
$ 1 r x a 0 B E ^ 1 ١, ل‎ x ^ 5 x t x ^ 


في نهاية هذه الخطوةء قمنا بتصور بعض صور الأزياء وتم إعداد وتنظيم مجموعة البيانات الخاصة بنا 
لتدريب نموذج الذكاء الاصطناعي. نحن الآن جاهزون للانتقال إلى الخطوة التالية حيث سنقوم ببناء 
الشبكة العصبية لتوليد صور أزياء جديدة. 


يُعد المولد أمرًا بالغ الأهمية ل «GAN‏ حيث يقوم بإنشاء صور أزياء جديدة. سنقوم بتصميم المولد 
باستخدام واجهة برمجة التطبيقات التسلسلية Sequential API‏ الخاصة ب Sly «TensorFlow‏ 
تتضمن طبقات مثل -Conv2DTransposes Reshapes LeakyR.eLU ; Dense‏ 


# Import the Sequential API for building models 
from tensorflow.keras.models import Sequential 


# Import the layers required for the neural network 
from tensorflow.keras.layers import ( 

Conv2D, Dense, Flatten, Reshape, LeakyReLU, Dropout, 
UpSampling2D 
) 


def build generator(): 
model = Sequential() 


# First layer takes random noise and reshapes it to 
12116 
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# This is the beginning of the generated image 
ocel- ace (Denss (7 = T = 108 out (ahmed?) ) 
odel.add(LeakyReLU(0.2)) 

odel.add(Reshape((7, 7, 128))) 


E BB 


# Upsampling block 1 
odel.add(UpSampling2D()) 
odel.add(Conv2D(128, 5, padding='same') ) 
odel.add(LeakyReLU(0.2)) 


E BB 


# Upsampling block 2 
odel.add(UpSampling2D()) 
ocel -acb (ConvZ2bDi(a28;, 5 

odel.add(LeakyReLU (0.2 


padding='same') ) 


E SB 


)) 
# Convolutional block 


1 
model.add(Conv2D(128, 4 
model.add(LeakyReLU(0.2 


, padding='same') ) 
)) 
# Convolutional block 


2 
model.add(Conv2D(128, 4 
model.add(LeakyReLU (0.2 


, padding='same') ) 
)) 
# Convolutional layer to get to one channel 


model.add(Conv2D(1, 4, padding='same', 
activation-'sigmoid!')) 


return model 


# Build the generator model 
generator = build generator () 
f Display the model summary 
generator.summary() 


المولد عبارة عن شبكة عصبية عميقة مسؤولة عن إنشاء صور أزياء مزيفة. فهو JEL‏ ضوضاء عشوائية 
كمدخل» ويكون إخراجه عبارة عن صورة ذات تدرج رمادي مقاس 28 x‏ 28 تبد وكعنصر أزياء. الهدف 
هو تلم eti] LAS‏ صو 425 Là yall pole‏ الستيقية. 
يتكون النموذج من عدة طبقات: 
:Dense Layer .1‏ الطبقة الأولى تأخذ ضوضاء عشوائية random noise‏ بحجم 128 وتعيد 
تشكيلها إلى موتر 7x 7x128‏ يؤدي هذا إلى إنشاء المعمارية الأولية للصورة التي تم إنشاؤها. 
:Upsampling Blocks .2‏ تعمل هذه الكتل على زيادة دقة الصورة تدريجيًا باستخدام طبقة 
iib Kt .(UpSampling2D‏ تلافيفية وتنشيط .LeakyReLU‏ تعمل طبقة 
Upsampling2D‏ على مضاعفة دقة الصورة على كلا البعدين. 
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:Convolutional Blocks .3‏ تعمل هذه الكتل على تحسين الصورة التي تم إنشاؤها. وهي 
تتكو ن من طبقات تلافيفية convolutional layers‏ مع cU‏ تنشيط -LeakyReLU‏ 

Convolutional Layer .4‏ : الطبقة التلافيفية النهائية تقلل القنوات إلى قناة واحدة» مما يؤدي 
بشكل فعال إلى إنشاء صورة الإخراج مع التنشيط sigmoid‏ لقياس قيم البكسل بين 0 و1. 


‘ot 1 
0 hope te 
———— a “RRB pon E aaa eres 
“ [we ٠ 
E ^ D 1 E 
v_serp ling : temi 4, 14 . 
ox 
we, 1 m 
feu “ 14, 1 3 
wp impl irg Lane! 1 s ° 
m 
2 oa, 28, 28, sor? 
we, M, 28, 328) 
ome, JE, 20, 104 
we, 18, 2, > 
m, 28, 22 
v ` m, 2, 1 
D $, 39, 04 


في نهاية هذه الخطوة. سيكون لدينا نموذج مولد قادر على إنتاج صور أزياء مزيفة. النموذج جاهز OV‏ 
للتدريب على الخطوات التالية من العملية. 


بناء المميز 
بدءًا من المفاهيم الأساسية لشبكات GAN‏ والتعمق تدريجيّافي تعقيدات توليد صور الموضة. من 
خلال المشاريع العملية والتعليمات خطوة d ase‏ سنرشدك خلال بناء نموذج GAN‏ الخاص بك 


.Keras; TensorFlow وتدريبه باستخدام‎ 


» ^ 
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واجهة برمجة التطبيقات التسلسلية Sequential API‏ الخاصة ب «TensorFlow‏ والتي تتضمن 
طبقات .Denses Dropouts LeakyR eLU ; Conv2D‏ 


cder DURES (hiexeseasbunsbavenerone (()) 8 
model = Sequential() 


4 First Convolutional Block 

MOC sell (ComwZD(s2, Dp amo Seve (AE, 28, 1))) 
model.add(LeakyReLU(0.2)) 

model.add(Dropout (0.4) ) 


# Second Convolutional Block 
model.add(Conv2D(64, 5)) 
model.add(LeakyReLU (0.2) ) 
model.add(Dropout (0.4) ) 


# Third Convolutional Block 
model addl(ConwAD(lA875 5) 
model.add(LeakyReLU (0.2) ) 
model.add(Dropout (0.4) ) 


# Fourth Convolutional Block 
model.add(Conv2D(256, 5)) 
model.add(LeakyReLU (0.2) ) 
model.add(Dropout (0.4) ) 


— 


# Flatten the output and pass it through a dense layer 
model.add(Flatten()) 

model.add(Dropout (0.4) ) 
model.add (Dense (1, activation='sigmoid') ) 


return model 


# Build the discriminator model 
discriminator = build discriminator () 
# Display the model summary 
discriminator.summary () 


يعد المميّز أيضًا شبكة عصبية عميقة لتصنيف ما إذا كانت الصورة المدخلة حقيقية أم مزيفة. يقوم 
بإدخال صورة ذات تدرج رمادي مقاس 28 x‏ 28 ويخرج قيمة ثنائية (1 للحقيقي» 0 للمزيف). 
يتكون النموذج من عدة طبقات: 
:Convolutional Blocks .1‏ تقوم هذه الكتل بمعالجة الصورة المدخلة بطبقات تلافيفية 
Kb convolutional layers‏ عمليات تنشيط LeakyReLU‏ والطبقات المتسربة 
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sels dropout layers‏ الطبقات المتسربة على منع الضبط الزائد overfitting‏ عن طريق 
إسقاط (حذف) بعض الخلايا العصبية بشكل عشوائي أثناء التدريب. 

:Flatten and Dense Layers .2‏ يتم تسوية مخرجات الكتلة التلافيفية الأخيرة إلى متجه 
أحادي الأبعاد ويتم تمريرها عبر طبقة كثيفة مع التنشيط -sigmoid‏ يؤدي التنشيط sigmoid‏ 
إلى سحق الإخراج بين 0 و1ء مما يمثل احتمال أن تكون الصورة حقيقية. 


في نهاية هذه الخطوة. سيكون لدينا نموذج مميز قادر على تصنيف ما إذا كانت الصورة المدخلة حقيقية 
ol‏ مزيفة. النموذج جاهز الآن للدمجفي معمارية GAN‏ وتدريبه على الخطوات التالية. 

ا در 

إعداد الاخطاء والمحسن 

من المولد والمميز. 


# Import the Adam optimizer and Binary Cross Entropy loss 
JEUNE TE ALTO 

from tensorflow.keras.optimizers import Adam 

from tensorflow.keras.losses import BinaryCrossentropy 


# Define the optimizers for the generator and discriminator 
g opt = Adam(learning rate-0.0001) # Generator optimizer 
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d opt = Adam(learning rate-0.00001) # Discriminator 
optimizer 


# Define the loss functions for the generator and 


discriminator 
G loss = BinanryCrossentropy RY) i Generator loss function 
d_loss = BinaryCrossentropy() # Discriminator loss function 


DLS عبارة عن خوارزمية تحسين‎ Adam لكل من المولد والمميز.‎ Adam سن‎ m bud o 
أثناء التدريب.‎ learning rate تعمل على تكييف معدل التعلم‎ 


بالنسبة لدوال الخطأ. نحن نستخدم الانتروبيا المتقاطعة الثنائية Binary Cross Entropy‏ تستخدم 
دالة الخطأ هذه بشكل شائعفي مشاكل التصنيف الثنائي» وهي مناسبة لمهمة التصنيف الثنائي الخاصة 
بأداة المميز (الحقيقية مقابل المزيفة). 


بناء نموذج فرعي 
بعد AUS‏ سنقوم ببناء نموذج فرعي model‏ 51150125560 يجمع بين نماذج المولد والمميزفي نموذج 
GAN‏ واحد. سيقوم هذا النموذج الفرعي بتدريب GAN‏ أثناء حلقة التدريب. 


from tensorflow.keras.models import Model 


class FashionGAN (Model): 
(esr _ imirt (Selt, generarcor;, المع تت‎ “aros; 
**kwargs): 
# Pass through args and kwargs to the base class 
stuper (o imie (AOI, "isses 


# Create attributes for generator and discriminator 
models 

self.generator = generator 

self.discriminator = discriminator 


cder comoilelselr;, cp opt, Cl osc, C LOSS, tcl loss; “args; 
**kwargs): 
# Compile with the base class 
super().compile(*args, **kwargs) 


# Create attributes for optimizers and loss 
functions 

seli- -g opr = Gr Opr 

seli. opr = بك‎ Opr 

selt g logs = e losis 

Sélic.cl loses = e loge 


cer traln Step (eel, baren); 
# Get the data for real images 
real images = batch 
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# Generate fake images using the generator with 
random noise as input 


fake images = self.generator(tf.random.normal((128, 


128, 1)), training-False) 


# Train the discriminator 

with tf.GradientTape() as d tape: 

f Pass real and fake images through the 
discriminator model 


yhat real = self.discriminator(real images, 
training-True) 

yhat fake = self.discriminator(fake images, 
training-True) 


Walshe _ 2561125153 = wit هم‎ bia Teal; 
yhat fake], axis=0) 


# Create labels for real and fake images 
y realfake - 

cic o 2623205 N [EE zeros alles (MEE EAL), 

tf.ones like(yhat fake)], axis=0) 


# Add some noise to the true outputs to make 
training more robust 


MOSS real = 0.15 * 
tf.random.uniform(tf.shape(yhat real)) 
MOSES taê = -0:15 %7 


tf.random.uniform(tf.shape(yhat fake)) 
y 1381152124 t= ti 68202615 ( [MOLISE real; 
nolge takel; exts=0) 


# Calculate the total discriminator loss 
corel cl loss = selt el loss (vy FOAL EEE, 
yhat_realfake) 


# Apply backpropagation and update discriminator 
weights 

EEA = Gl rape Cuceclicine (tocal Gl loss, 
self.discriminator.trainable variables) 

self.d opt.apply gradients (zip ) 
self.discriminator.trainable variables)) 


# Train the generator 
with tf.GradientTape() as g tape: 


# Generate new images using the generator with 


random noise as input 

gen images - 
self.generator(tf.random.normal((128, 128, 1)), 
training-True) 
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# Create the predicted labels (should be close 
to 1 as they are fake images) 

preciertecl lebelg = 
self.discriminator(gen images, training-False) 


# Calculate the total generator loss (tricking 
the discriminator to classify the fake images as real) 
cece dj Joss = 
SELE. losis (ier. ZOOS libe 5256116536 labels), 
predicted labels) 


# Apply backpropagation and update generator weights 

ggrad = g tape.gradient (total g loss, 
self.generator.trainable variables) 

self.g opt.apply gradients (zip(ggrad, 
self.generator.trainable variables)) 


return ("cl loms"s total cl loss; "e LOSS 
tortal gi loss} 


# Create an instance of the FashionGAN model 
fashgan = FashionGAN (generator, discriminator) 


# Compile the model with the optimizers and loss functions 
fashgan.compile(g opt, d_opt, g_loss, d_loss) 


o‏ نقوم بإنشاء نموذج FashionGAN‏ ذو £3 5 4 (subclassed FashionGAN)‏ يمتد 
إلى فئة .tfkeras.models.Model‏ سيتعامل هذا النموذج الفرعي مع عملية التدريب 
لشبكة .GAN‏ 
o‏ في طريقة Train step‏ نحدد حلقة التدريب لشبكة :GAN‏ 
0 تحضل det‏ سور SE‏ من الدفعة وننشئ صورًا مزيفة باستخدام نموذج المولد مع 
ضوضاء عشوائية كمدخل. 
O‏ ثم نقوم بتدريب المميز: 
u‏ نستخدم Ús å‏ متدرجًا gradient tape‏ لحساب ks‏ المميز فيما يتعلق بالصور 
الحقيقية والمزيفة. الهدف هو جعل المميز تصنف الصور الأصلية على أنها 1 
والصور المزيفة على أنها 0. 
نضيف بعض الضوضاء إلى المخرجات الحقيقية لجعل التدريب أكثر قوة وأقل 
عرضة للضبط الزائد. 
* يتم حساب إجمالي خطأ المميز على أنها إنتروبيا متقاطعة ثنائية بين التسميات 
المتوقعة والمستهدفة. 
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* نحن نطبق الانتشار الخلفى backpropagation‏ لتحديث أوزان المميّز tly‏ على 
الخطأ المحسوب. l‏ 
o‏ بعد ذلك نقوم بتدريب المولد: 
T‏ نقوم بإنشاء صور مزيفة جديدة باستخدام المولد مع ضوضاء عشوائية كمدخل. 
o"‏ نحن نحسب إجمالي خطأ المولد على أنها إنتروبيا متقاطعة ثنائية بين التسميات 
المتوقعة (الصور التي تم إنشاؤها) والتسميات المستهدفة )0 تمثل صورًا مزيفة). 
Gage‏ المولد إلى "خداع' jell‏ من خلال توليد صور يصنفها eI‏ على tel‏ 
حقيقية (مع علامة قريبة من 1). 
" نحن نطبق الانتشار الخلفى لتحديث أوزان المولد tly‏ على الخطأ المحسوب. 
o‏ وأخيراء نعيد إجمالي الاخطاء للمميق والمولد خلال هذه الخطوة التدريبية. 


أصبح نموذج FashionGAN‏ جاهرًا الآن Cyt‏ باستخدام مجموعة بيانات التدريبفي الخطوة 
التالية. 


clu‏ رد الاتصال 

عمليات رد الاتصال TensorFlow 3Callbacks‏ هي دوال يمكن تنفيذها أثناء التدريبفي نقاط 
atao‏ مثل نهاية Le epochs z‏ سنقوم بإنشاء رد اتصال مخصص ModelMonitor aw‏ لإنشاء 
الصور وحفظهافي نهاية كل فترة لمراقبة تقدم شبكة GAN‏ 


import os 

from tensorflow.keras.preprocessing.image import 
array to img 

from tensorflow.keras.callbacks import Callback 


class ModelMonitor (Callback): 
cer inte (selt, mim AMIS, latent acum 1123 s 
self.num img = num img 
selt lerene Chin = larene (latin 


def on epoch end(self, epoch, logs-None): 

# Generate random latent vectors as input to the 
generator 

random latent vectors = 
tf.random.uniform((self.num img, self.latent dim, 1)) 

# Generate fake images using the generator 

generated images - 
self.model.generator(random latent vectors) 

generate! imeges Y= 2993 

generated images.numpy() 

EOE 1 alin. 12268 (eel wb MC) £ 

f Save the generated images to disk 
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img = array to img(generated images[i]) 
img.save(os.path.join('images', 

E eme EE EES ime (epoch; Lir one) 

Abo oc‏ رد الاتصال ModelMonitor‏ وسيطتين: num. img‏ . الذي يحدد عدد الصور التى 


سيتم إنشاؤها وحفظهافي نهاية كل فترة» latent dim‏ وهو بعد متجه الضوضاء العشوائي 
random noise vector‏ المستخدم كمدخل JJ bali‏ 

u‏ أثناء طريقة «on epoch end‏ يقوم رد الاتصال بإنشاء num img‏ متجهات كامنة 
عشواثية وتمريرها كمدخلات إلى المولد. يقوم المولد بعد ذلك بإنشاء صور مزيفة Ps‏ على 
هذه المتجهات العشوائية. 

يتم تحجيم الصور التي تم إنشاؤها إلى نطاق 255-0 ويتم حفظها كملفات NG‏ في دليل 
"images"‏ تتضمن أسماء الملفات رقم الفترة لتتبع التقدم مع مرور الوقت. 


تدريب GAN‏ 
الآن بعد أن قمنا بإعداد نموذج GAN‏ ورد الاتصال المخصص. يمكننا بدء عملية التدريب باستخدام 
طريقة -fit‏ سنقوم بتدريب GAN‏ لفترات كافية للسماح للمولد والمميز converge LIL‏ والتعلم 

من بعضهما البعض. 
Train the GAN model‏ # 


hist = fashgan.fit(ds, epochs=20, 
callbacks-[ModelMonitor()]) 


.GAN لتدريب‎ FashionGAN لنموذج‎ fit نستخدم طريقة‎ god o* 

or‏ قمنا بتعيين عدد الفترات على 20 (قد تحتاج إلى المزيد من الفترات للحصول على نتائج 
أفضل). 

o"‏ نقوم بتمرير رد اتصال ModelMonitor‏ لحفظ الصور التي تم USUS‏ نهاية كل فترة. 

t‏ سيتم تكرار عملية التدريب على مجموعة البيانات» ولكل habs‏ سيتم تحديث أوزان نماذج 
المولد والمميز باستخدام حلقة التدريب المحددة Gona‏ 


يمكن أن تستغرق عملية التدريب بعض الوقت. اعتمادًا على أجهزتك وعدد الفترات. بعد التدريب» 
يمكننا مراجعة أداء شبكة GAN‏ من خلال رسم اخطاء المميز والمولد. سيساعدنا هذا على فهم مدى 
جودة تدريب النماذج وما إذا كانت هناك أي علامة على التقارب convergence‏ أو انهيار الوضع 
bes mode collapse‏ ننتقل إلى الخطوة التالية» وهي مراجعة أداء .GAN‏ 


n 
CS 
Ol 


cal po‏ الأداء واختبار المولد 

مراجعة الأداء 

بعد تدريب «GAN‏ يمكننا مراجعة أدائها من خلال رسم اخطاء المميز والمولد خلال فترات التدريب. 
سيساعدنا هذا على فهم مدى جودة تعلم GAN‏ وما إذا كانت هناك أية مشكلات» مثل انهيار الوضع 
mode collapse‏ أو التدريب غير المستقر .unstable training‏ 


import matplotlib.pyplot as plt 


# Plot the discriminator and generator losses 
plt.suptitle('Loss') 

plt- olor (oist history e LOSS I], ESN Jo") 
plt- olor (aist leat eneroxes YG lossil; UE OSS) 
plt.legend() 

plt.show() 


* نحن نستخدم matplotlib‏ لرسم اخطاء المميز والمولد خلال فترات التدريب. 

* يمثل المحور السيني رقم الفترةء ويمثل المحور الصادي الاخطاء المقابلة. 

2 من المفترض أن تنخفض اخطاء المميز (d loss)‏ وخطأ المولد (g loss)‏ بشكل مثالي على 
مدار الفترات كما تتعلم GAN‏ 1 1 


اختبار المولد 
بعد تدريب GAIN‏ ومراجعة أدائه. يمكننا اختبار المولد عن طريق إنشاء صور أزياء جديدة وتصورها. 
أولاء سنقوم بتحميل أوزان المولد المدرب واستخدامه لتوليد صور جديدة. 
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# Load the weights of the trained generator 
generator.load weights('generator.h5') 


# Generate new fashion images 
imgs = generator.predict(tf.random.normal((16, 128, 1))) 


# Plot the generated images 
fig, ax = plt.subplots(ncols=4, nrows=4, figsize=(10, 10)) 
for r in range(4): 
for c in range(4): 
ميد‎ EI [el اهمها مسد‎ lings t + 1) ~ (e + 1) Jp 


py‏ بتحميل أوزان المولد المدرب من الملف المحفوظ باستخدام 
.generator.load weights(generator.h5)‏ 

c‏ نقوم بإنشاء صور أزياء جديدة عن طريق تمرير متجهات كامنة عشوائية إلى المولد. يفسر 
المرلد هذه المعجهات العشوائية ويولك الضور المقابلة. 

* — نستخدم matplotlib‏ لعرض الصور التي تم إنشاؤهافي شبكة 4 Ax‏ 


حفظ النموذج 
أخيراء إذا كنت راضيًا عن أداء GAN‏ الخاص th‏ فيمكنك حفظ نماذج المولد والمميز لاستخدامها 
في المستقبل. 

# Save the generator and discriminator models 


generator.save('generator.h5') 
discriminator.save('discriminator.h5') 


شبكات الخصومة التوليدية 137 


n‏ نقوم بحفظ نماذج المولد والمميز على القرص باستخدام طريقة الحفظ. 

§ سيتم Bam‏ النماذجني دليل العمل الحالي بأسماء الملفات 'generator.h5"‏ 
"discriminator.h5"s‏ على التو الي. 

c‏ يتيح لك حفظ النماذج استخدامها i M‏ لإنشاء المزيد من صور الأزياء أو لمواصلة عملية 
التدريب. 


وبهذا تنتهي عملية بناء وتدريب شبكة GAN‏ لتوليد صور الموضة باستخدام !Keras; TensorFlow‏ 
تعد شبكات GAN‏ نماذج قوية لتوليد بيانات واقعية ويمكن تطبيقها على مهام أخرى. 


تذكر أن جودة الصور التي تم إنشاؤها تعتمد على معمارية GAN‏ وعدد فترات التدريب» وحجم 
مجموعة البيانات» والمعلمات الفائقة الأخرى. لا تترددفي تجربة GAN‏ وضبطها لتحقيق نتائج أفضل. 
توليد سعيد !Happy generating‏ 


تحسينات إضافية والاتجاهات المستقبلية 

تهانينا على إكمال GAN‏ لإنشاء صور الموضة! OW‏ دعنا نستكشف بعض التحسينات الإضافية 
والاتجاهات المستقبلية التي يمكنك وضعهافي الاعتبار لتحسين أداء GAN‏ وإنشاء صور أزياء AST‏ 
واقعية وتنوعا. 


ضبط المعلمات الفائقة 

يمكن أن يؤثر ضبط المعلمات الفائقة Hyperparameter Tuning‏ بشكل كبير على أداء شبكة 
GAN‏ قم بتجربة معدلات التعلم المختلفةء وأحجام الدفعات» وعدد فترات التدريب» وتكوينات 
المعمارية للمولد والمميز. يعد ضبط المعلمات الفائقة (al‏ ضروريًا لتدريب «GAN‏ حيث يمكن أن 
يؤدي إلى تقارب أفضل ونتائج أكثر استقرارًا. 


استخدام النمو التدريجي 
تبداً النمو التدريجي Progressive Growing‏ تدريب GAN‏ بصور منخفضة BU)‏ وتزيد Bo‏ 
الصورة تدريجيًا أثناء التدريب. يساعد هذا الأسلوب على استقرار التدريب وينتج صورًا ذات جودة 
أعلى. يمكن أن يكون تنفيذ النمو التدريجي أكثر res‏ ولكنه يؤدي غالبا إلى نتائج أفضل. 

Wasserstein GAN (WGAN) تنفيذ‎ 

فر استخدام Wasserstein GAN (WGAN)‏ مع عقوبة التدرج gradient penalty‏ بدلاً من 
خطأ GAN‏ القياسية. يمكن أن توفر WGAN‏ تدريبًا أكثر استقرارًا وتدرجات أفضل أثناء عملية 
التحسين. يمكن أن يؤدي هذا إلى تحسين التقارب وتقليل حالات انهيار الوضع. 
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óab j‏ البيانات 
تطبيق تقنيات زيادة البيانات data augmentation‏ على مجموعة بيانات التدريب. يمكن أن يشمل 
ذلك عمليات التدوير العشوائية والقلبات والترجمات والتحويلات الأخرى. تساعد زيادة البيانات شبكة 

GAN‏ على التعميم بشكل أفضل ويمكن أن تمنع الضبط الزائد لمجموعة التدريب. 

تضمين معلومات التسمية 

إذا كانت مجموعة البيانات الخاصة بك تحتوي على معلومات التسمية information‏ 1ع 126( على 
سبيل المثال» ks‏ الملابس (clothing categories‏ فيمكنك محاولة GAN AS‏ على 
معلومات التسمية أثناء التدريب. وهذا يعني تزويد المولد والمميز بمعلومات إضافية حول نوع الملابس» 
والتي يمكن أن تساعد GGAN‏ إنشاء المزيد من صور الأزياء الخاصة بفئة معينة. 


uno à) Jao استخدام مميز‎ 

يمكن أن يساعد استخدام المميز المدربة ópretrained discriminator FR‏ تسريع التدريب 
Guindy‏ استقرار GAN‏ يمكنك: Gye‏ المميق على مهمة تصنيف باستخدام مجموعة بيانات 
MNIST‏ للأزياء بشكل مستقل ثم استخدام المميز المدربة مسبقًا كنقطة بداية لتدريب GAN‏ 


جمع مجموعة بيانات أكبر وأكثر تنوعا 

غاليًا ما يكون أداء شبكات GAN‏ أفضل مع مجموعات البيانات الأكبر والأكثر تنوعًا. فكرفي جمع أو 
استخدام مجموعة بيانات أكبر تحتوي على مجموعة واسعة من أنماط الموضة والألوان والأنماط. يمكن 
لمجموعة البيانات الأكثر تنوعًا أن تؤدي إلى صور أكثر تنوعًا وواقعية. 

اكتشاف معماريات مختلفة 

تجربة مع مختلف معماريات المولد والمميز. هناك العديد من الأشكال المختلفة لشبكات (GAN‏ 
«CGAN (Conditional GAN); .DCGAN (Deep Convolutional GAN) Jie‏ 
StyleGANs‏ تتمتع كل معمارية bliy‏ القوة والضعف الخاصة بهاء ويمكن أن توفر تجربة نماذج 
مختلفة رؤى قيمة حول ما هو الأفضل لمهمتك المحددة. 

الستخدام نقل التعلم 

إذاكان بإمكانك الوصول إلى نماذج GAN‏ المدربة مسبقاء فيمكنك استخدامها كنقطة بداية ل GAN‏ 
للأزياء الخاصة بك. يمكن أن يؤدي الضبط الدقيق Fine-tuning‏ لشبكة GAN‏ المدربة e‏ إلى 
توفير الوقت والموارد الحسابية مع تحقيق نتائج جيدة. 
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مراقبة انهيار الوضع 

يحدث انهيار الوضع Mode collapse‏ عندما ينهار المولد لإنتاج أنواع قليلة فقط من الصور. راقب 
العينات التي تم إنشاؤها boy‏ عن علامات انهيار الوضع واضبط عملية التدريب Giy‏ لذلك إذا لاحظت 
هذا السلوك. 


يعد بناء شبكات GAN‏ وتدريبها عملية متكررة» وغالبًا ما يتطلب تحقيق نتائج مبهرة التجريب والضبط 
الدقيق. استمرفي الاستكشاف والتعلم وتكييف شبكة GAN‏ الخاصة بك لإنشاء صور أزياء أفضل! 


بهذا نختتم رحلتنافي إنشاء صورة أزياء GAN‏ باستخدام .Keras; TensorFlow‏ لا 22,5 
استكشاف تطبيقات GAN‏ الأخرى. مثل إنشاء أعمال فنية أو وجوه أو كائنات ثلاثية الأبعاد. أحدثت 
شبكات GAN‏ ثورةفي مجال النمذجة التوليدية ولا تزال مجالًا مثيرًا للبحث والتطويرني مجتمع الذكاء 
الاصطناعي. حظا سعيداني مشاريع GAN‏ المستقبلية الخاصة بك! 


الاستنتاج 

في الختام» تمثل شبكات الخصومة التوليدية (GAINS)‏ تقنية متطورةفي الذكاء الاصطناعي أحدثت ثورة 
في إنشاء عينات البيانات الاصطناعية. خلال هذا الدليلء اكتسبنا فهمًا عميقا لشبكات GAN‏ ونجحنا 
في بناء مشروع رائع: شبكة clin GAN‏ صور الموضة. 


1. شبكات GAN‏ تتكون شبكات GAN‏ شبكتين عصبيتين» شبكة المولد والمميزء والتي 
تستخدم التدريب التنافسي لإنشاء عينات بيانات واقعية. l‏ 

2. هدف المشروع: نحن نهدف إلى تطوير GAN‏ التي تولد صور أزياء تشبه تلك الموجودة 
في مجموعة بيانات -Fashion MNIST‏ 

3. مجموعة البيانات: كانت مجموعة بيانات Fashion MNIST‏ التى تحتوي على صور 
ذات تدرج رمادي لعناصر الموضة: بمثابة الأساس لمولد صور الأزياء الخاص by‏ 

4. بناء شبكة GAN‏ قمنا ببناء المولد والمميز باستخدام واجهة برمجة التطبيقات التسلسلية 
Sequential API‏ الخاصة ب .TensorFlow‏ والتي تتضمن oub‏ مثل Dense‏ 
.LeakyR eLU; Conv2Ds;‏ 

dala .5‏ تدريب GAN‏ استخدمنا حلقة تدريب مصممة بعناية لتحسين المولد والمميز 
afe Jets‏ 

6. التحسينات: استكشفنا العديد من التقنيات لتحسين أداء Gly «GAN‏ ذلك ضبط 
المعلمات الفائقة. ply‏ التدريجى. «Wasserstein GAN»‏ وزيادة GAN; bl!‏ 
المشروطة. l‏ 
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7. التقييم: ناقشنا مقاييس التقييم مثل FID; Inception Score‏ لتقييم جودة صور الأزياء 
التي تم إنشاؤها بشكل موضوعي. 
8. الضبط الدقيق ونقل التعلم: من خلال الضبط الدقيق للمولد واستخدام النماذج المدربة 
مسبقاء كنا نهدف إلى تحقيق توليد صور أزياء أكثر تنوعًا وواقعية. 
9. الاتجاهات المستقبلية: هناك فرص لا حصر لها لمزيد من التحسينات والبحثفي شبكات 
Gls «GAN‏ ذلك تحسين المعلمات الفائقة« والنمو التدريجي. «Wasserstein GAN;‏ 
والمزيد. l‏ 
باختصار قدم هذا الدليل الشامل أساسًا متیتا لفهم شبكات GAN‏ وتعقيدات تدريبهاء وكيف يمكن 
تطبيقها على توليد صور الموضة. لقد أظهرنا إمكانية إنشاء بيانات اصطناعية متطورة وواقعية من خلال 
استكشاف التقنيات والتطورات المختلفة. ومع تطور شبكات GAIN‏ فإنها على استعداد لإحداث 
GU ed‏ مختلف الصناعات» Gly‏ ذلك الفن والتصميم والرعاية الصحية والمزيد. إن احتضان القوة 
المبتكرة لشبكات GAN‏ واستكشاف إمكانياتها اللامحدودة هو مسعى مثير سيشكل بلا شك مستقبل 
الذكاء الاصطناعي. 


guide-to-fashion-image-generation/ 
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7] توليد الصور باستخدام شبكات الخصومة التوليدية 
Images Generation using GANs‏ 
المقدمة 
في هذه Mili‏ نستكشف تطبيق شبكات TensorFlow EGAN‏ لإنشاء إصدارات فريدة من الأرقام 
المكتوبة بخط اليد. يتكون إطار عمل GAN‏ من مكونين رئيسيين: المولد generator‏ والمميز 
discriminator‏ يقوم المولد بإنشاء صور جديدة بطريقة عشوائيةء بينما تم تصميم المميز للتمييز بين 
الصور الأصلية والمقلدة. من خلال تدريب (GAN‏ حصلنا على مجموعة من الصور التى تشبه إلى حد 
كبير الأرقام المكتوبة بخط اليد. الهدف الأساسي من هذه المقالة هو تحديد الإجراء M‏ ببناء وتقييم 
شبكات GAN‏ باستخدام مجموعة بيانات -MNIST‏ 
أهداف التعلم 
1( توفر هذه المقالة مقدمة شاملة لشبكات الخصومة التوليدية Generative Adversarial‏ 
Networks (GANs)‏ وتستكشف UU das‏ توليد الصور. 
2( الهدف الرئيسي من هذا البرنامج التعليمي هو توجيه القراء خلال عملية خطوة بخطوة لإنشاء 
شبكة GAN‏ باستخدام مكتبة .TensorFlow‏ ويغطي تدريب GAN‏ على مجموعة بيانات 
1517 لإنشاء صور جديدة e SU‏ المكتوبة بخط اليد. 
3 يناقش المقال معمارية ومكونات شبكات GAN‏ بمافي ذلك المولدات والمميزات» لتعزيز 
فهم القراء لأعمالهم الأساسية. 
4( للمساعدةفي التعلم. تتضمن المقالة أمثلة التعليمات البرمجية التي توضح المهام المختلفة 
مثل قراءة مجموعة MNIST GUL,‏ ومعالجتها مسبقاء وبناء بنية GAN‏ وحساب دوال 
الخطأ. وتدريب الشبكةء وتقييم النتائج. 
5( علاوة على Wd‏ يستكشف المقال النتيجة المتوقعة لشبكات «GAN‏ وهي عبارة عن 
مجموعة من pall‏ التي تحمل Sade GLS‏ مع الأرقام المكتوبة بخط اليد. 


ماذانبنی؟ 
يعد إنشاء صور جديدة باستخدام قواعد بيانات الصور الموجودة مسبقًا سمة بارزة للنماذج المتخصصة 


التي تسمى شبكات الخصومة التوليدية (GANS)‏ تتفوق شبكات EGAN‏ إنتاج صور غير خاضعة 
للإشراف أو شبه خاضعة للإشراف من خلال الاستفادة من مجموعات بيانات الصور المتنوعة. 

تستغل هذه المقالة إمكانات توليد الصور لشبكات LEY GAN‏ أرقام مكتوبة بخط اليد. تتضمن 
المنهجية تدريب الشبكة على قاعدة بيانات رقمية مكتوبة بخط اليد.في هذه المقالة التعليمية» سنقوم 
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ببناء شبكة GAN‏ بدائية باستخدام مكتبة CTensorflow‏ وإجراء التدريب على مجموعة بيانات 
MNIST‏ وإنشاء صور جديدة للأرقام المكتوبة بخط اليد. 
كيف نقوم باعداد هذا؟ 
يتمحور التركيز الأساسي لهذه المقالة حول تسخير إمكانات توليد الصور لشبكات GAN‏ يبدأ الإجراء 
بالتحميل والمعالجة المسبقة لقاعدة بيانات الصور لتسهيل عملية تدريب .GAN‏ بمجرد تحميل 
البيانات بنجاح» las‏ إنشاء نموذج GAN‏ وتطوير الكود اللازم للتدريب والاختبار.في القسم التالي 
يتم توفير تعليمات مفصلة حول تنفيذ هذه الدالة وإنشاء صورة جديدة باستخدام قاعدة بيانات 
.MNIST‏ 
بناء النموذج 
يتكون نموذج GAN‏ الذي نهدف إلى بناءه من عنصرين مهمين: 

:GeneratorajgoJl e‏ هذا المكون مسؤول عن إنشاء صور جديدة. 

:Discriminator jio.oJ| e‏ يقوم هذا المكون بتقييم جودة الصورة التي تم إنشاؤها. 
تظهر المعمارية العامة التي سنقوم بتطويرها لإنشاء الصور باستخدام GGAN‏ الرسم البياني أدناه. يقدم 
القسم JE‏ وصمًا موجرًا لكيفية قراءة قاعدة البيانات وإنشاء المعمارية المطلوبة وحساب l‏ الخطأ 
وتدريب الشبكة. بالإضافة إلى AUS‏ يتم توفير التعليمات البرمجية لفحص الشبكة وإنشاء صور جديدة. 


Generative Adversarial Network 
Real Samples 


Latent Space T 
| ; If ái 3 
n m D A IsD 


Discriminator} 


H r-e-|-5 


| 
`s Correct? كر‎ 


Generator Generated 
Fake Samples 


4 - 
e ; Fine Tune 


Training 


Noise 
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قراءة مجموعة البيانات 


تتمتع مجموعة بيانات MNIST‏ بأهمية كبيرةفي مجال الرؤية الحاسوبية computer vision‏ وتضم 
مجموعة كبيرة من الأرقام المكتوبة بخط اليد بأبعاد 28 x‏ 28 بكسل. أثبتت مجموعة البيانات هذه أنها 
مثالية لتنفيذ GAN‏ نظرًا لتنسيق الصورة أحادي القناة ذي التدرج الرمادي. 


يوضح مقتطف التعليمات البرمجية اللاحق استخدام Jl»‏ مضمنةفي Tensorflow‏ لتحميل مجموعة 
بيانات MNIST‏ عند التحميل الناجح. نبدأفي تسوية normalize‏ الصور وإعادة تشكيلها إلى تنسيق 
ثلاثي الأبعاد. يتيح هذا التحويل المعالجة الفعالة لبيانات الصور ثنائية الأبعاد ضمن معمارية -GAN‏ 
بالإضافة إلى US‏ يتم تخصيص الذاكرة لكل من بيانات التدريب والتحقق من الصحة. 


يتم تعريف شكل كل صورة على أنه مصفوفة (28x28x1‏ حيث يمثل البعد الأخير عدد القنواتفي 
الصورة. OY GE‏ مجموعة بيانات MNIST‏ تشتمل على صور ذات تدرج رمادي» فلدينا قناة واحدة 


"zsize" المشار إليها ب‎ latent space هذه الحالة تحديداء قمنا بتعيين حجم المساحة الكامنة‎ T 
لمتطلبات أو تفضيلات محددة.‎ dy على 100 ويمكن تعديل هذه القيمة‎ 


crom 21222 _ MMOLE Prine _ HUME E LOM, ل كك‎ eum 

from keras.datasets import mnist 

from keras.layers import Input, Dense, Reshape, Flatten, 
Dropout 
from keras.layers import BatchNormalization, Activation, 
ZeroPadding2D 
from keras.layers import LeakyReLU 

from keras.layers.convolutional import UpSampling2D, Conv2D 
from keras.models import Sequential, Model 

from keras.optimizers import Adam, SGD 


import matplotlib.pyplot as plt 

import sys 

import numpy as np 

num rows = 28 

mim Colg = 28 

num channels = 1 

input shape = (num rows, num cols, num channels) 
z Save = 100 

(crena mS; Ae dits J) = MTSE. loas! cece (()) 
treim imma = train ims / 12755 = i. 

train ims = np.expand dims(train ims, axis-3) 


valigi = كرس‎ omes ( (OEE size; 1) 
rake = np ueicos ) (oaren Sheer 1)) 
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تعريف المولد 


Latent Space 


| Generated 
Fake Samples 


| | 


^ f / 1 1 L i i D 74 N 8 
L y - 1 5 5 p 0ئ‎ N 
5 , x Correct? / 
Generator(G) | = \ f 


- 


ل ^ 


Discriminator(D) 


^ 
Real 


Samples 


Fine Tuning 


oral‏ إنه بمثابة المكون الأساسي لتكوين الصورةفي شبكات GAIN‏ هذه الدراسةء نستخدم معمارية 
محددة للمولدء والتي تتضمن طبقة متصلة بالكامل fully connected (FC)‏ وتستخدم lo‏ 
.Leaky ReLU‏ ومع «AUS‏ تجدر الإشارة إلى أن الطبقة الأخيرة من المولد تستخدم تنشيط TanH‏ 
بدلاً من LeakyReLU‏ تم إجراء هذا التعديل للتأكد من أن الصورة التي تم إنشاؤها موجودة ضمن 
نفس الفاصل الزمنى (-1. 1) مثل iae‏ بيانات MNIST‏ الأصلية. 

def build generator(): 

gen model - Sequential() 

gen model.add(Dense(256, input dim-z size)) 

gen model.add(LeakyReLU(alpha-0.2)) 

gen model.add(BatchNormalization (momentum=0. 8) ) 


( 
( 
( © 
gen model.add(Dense(512)) 
gen model.add(LeakyReLU(alpha-0.2)) 
( © 
( 1 
( e 
( 
( 


gen model.add(BatchNor 
gen model.add(Dense(1024)) 
gen model.add(LeakyReLU(alpha-0.2)) 
gen model.add(BatchNormalization (momentum=0. 8) ) 
gen model.add(Dense(np.prod(input shape), 
activation-'tanh')) 
gen model.add(Reshape(input shape)) 


malization(momentum-0.8)) 


Gen 156133 = Tmpotrlenapesl(z S57 )) )) 
gen img = gen _ model (gen noise) 
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return Model(gen noise, gen img) 
تعريف المميز‎ 
المهمة الحاسمة المتمثلةفي التمييز بين‎ (D) al يؤدي‎ (GAN) في شبكة الخصومة التوليدية‎ 
الصور الحقيقية والصور المولدة من خلال تقييم صحتها واحتماليتها. يمكن اعتبار هذا المكون بمثابة‎ 
لمعالجة هذه المهمة. يمكننا استخدام‎ .binary classification problem مشكلة تصنيف ثنائية‎ 
وطبقات‎ Leaky ReLU وتنشيط‎ (FC) معمارية شبكة مبسطة تشتمل على طبقات متصلة بالكامل‎ 
متبوعة‎ FC تتضمن طبقة‎ Discriminator من المهم الإشارة إلى أن الطبقة الأخيرة من‎ -Dropout 
التنشيط 51872010 احتمالية التصنيف المطلوبة.‎ Jl» تنتج‎ .Sigmoid بتنشيط‎ 
def build discriminator(): 
Gbis model = Secmemenal () 
disc model.add(Flatten(input shape-input shape) ) 
disc model.add(Dense(512)) 


( 
disc model.add(LeakyReLU(alpha-0.2)) 
disc_model.add(Dense (256) ) 
( 
( 


disc model.add(LeakyReLU(alpha-0.2)) 
disc model.add(Dense(1, activation-'sigmoid')) 


disc img = Input(shape-input shape) 
validity - disc model(disc img) 
return Model(disc img, validity) 


حساب Ula‏ الخطأ 
من أجل ضمان عملية جيدة لتوليد الصورفي شبكات GAN‏ من المهم تحديد المقاييس المناسبة 
لتقييم أدائها. حدد هذه المعلمة بواسطة دالة الخطأ loss function‏ 


والمميز مسؤول عن تقسيم الصورة المولدة إلى حقيقية أو مزيفة وإعطاء احتمال أن تكون حقيقية. 
لتحقيق هذا الاختلاف. يهدف المميز إلى تعظيم الدالة D(x)‏ عند تقديمها بصورة حقيقية وتقليل 
D(G(z))‏ عند تقديمها بصورة مزيفة. 

ومن ناحية أخرى» فإن الغرض من المولد هو خداع المُميّز من خلال إنشاء صورة واقعية يمكن إساءة 
تفسيرها. رياضيًاء يتضمن ذلك قياس D(G(z))‏ ومع ذلك. فإن الاعتماد فقط على هذا المكون كدالة 
خطأ يمكن أن يتسببفي زيادة ثقة الشبكة بالنتائج الخاطئة. لحل هذه المشكلةء نستخدم سجل دالة 
الخطأ DG)‏ 


يمكن التعبير عن دالة التكلفة الإجمالية ل GAN‏ لإنشاء صورة باعتبارها لعبة بسيطة: 


min G max D V(D,G) = E(xp data(x)) (log(D(x))] + E(zp(z)) (log(1 - D(G(z)))1) 
هذا توازنًا جيدا ويمكن أن يكون بمثابة مباراة بين خصمين. يسعى كل طرف‎ GAN يتطلب تدريب‎ 
.MinMax للتأثير على الآخر والتفوق عليه من خلال ممارسة لعبة‎ 
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يمكننا استخدام خطأ الانتروبيا المتقاطعة الثنائية Binary Cross Entropy Loss‏ لتنفيذ المولد 
والمميز. 
لتنفيذ المولد والمميزء يمكننا الاستفادة من خطأ الانتروبيا المتقاطعة الثنائية. 


f discriminator 

MRA EOE ()‏ 2ت 411 OU LC‏ كتهت انق 

GSE Comoile (LOSS 7 binary 526883312815637 7 y 
optimizer-'sgd', 
metrics-['accuracy!']) 


z = Input (muse (z Sie, J) (| 


# generator 
img = generator (z) 


disc.trainable = False 
validity = disc(img) 


# combined model 
combined = Model(z, validity) 
combined.compile(loss-'binary crossentropy', 
optimizer-'sgd') 
U 0 JI 8 1 .. 
تدور عملية التعلم هذه حول‎ .MinMax لعبة‎ QGAN لتسهيل تدريب الشبكة. هدفنا هو إشراك‎ 
من أجل تسريع‎ -Gradient Descent تحسين أوزان الشبكة من خلال استخدام التدرج الاشتقاقي‎ 
يتم استخدام‎ «suboptimal loss landscapes مع‎ convergence عملية التعلم ومنع التقارب‎ 
Stochastic Gradient Descent (SGD) التدرج الاشتقاقي العشوائي‎ 
المميز والمولد لهما اخطاء مختلفة؛ لا يمكن لدالة خطأ واحدة تحسين كلا النظامينفي وقت‎ oY نظرًا‎ 
واحد. وبالتالي» استخدم دوال الخطأ المنفصلة لكل نظام.‎ 
cer 611535 266131 ()) 8 
601156-15 11101 عت عا 1 دمت !كك‎ (0) 
CEE c COMIN LE 1 ا ات‎ CLOSES EO y 


optimizer='sgd', 
metrics=['accuracy']) 


generator = build generator () 


4 = mourt (Sites (us abe )) )) 
img = generator (z) 


disc.trainable = False 
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validity = disc(img) 


combined = Model(z, validity) 
combined.compile(loss-'binary crossentropy', 
optimizer='sgd') 
return disc, Generator, and combined 
بعد تحديد جميع الميزات المطلوبةء يمكننا تدريب النظام وتحسين الخطأ. فيما يلي خطوات تدريب‎ 
لإنشاء صورة:‎ GAN 


0 قم بتحميل الصورة وقم بإنشاء صوت عشوائي بنفس حجم الصورة المحملة. 

ه التمييز بين الصورة التي تم تحميلها والصوت الناتج والنظرفي إمكانية كونها حقيقية أو مزيفة. 
٠‏ قم بإنتاج ضوضاء عشوائية أخرى بنفس الحجم وقم بتوفيرها كمدخل للمولد. 

e‏ تدريب المولد لمدة محددة. 

e‏ كرر هذه الخطوات حتى تصبح الصورة مرضية. 


cder EEA (epoche, barch Sze 3 sanole intsrval=50) s 
# load images 
(cren dinis. oe Cs ) = mnist.load data () 
# preprocess 
brain Ms = train ans / 127.5 = 15 
EEA AMS = بوره‎ crxoruskel Chine (crain AMS, AX1) 


Wel iG = MS. ORES sse. Size; 1)) 
Takes = xo Zeros loaren size; 1)) 
# training loop 

for epoch in range (epochs): 


batch index = np.random.randint (0, 
train imes Slaves [ON ن‎ BAEC size) 


imgs — train ims[batch index] 
# create noise 
دهم‎ XS = هرم‎ rendom- DOMAN (O, i, (berch size, 2 Salva) )) 
# predict using a Generator 
gen MCS = gen. pPrecLer (moise) 
f calculate loss functions 
nealldasce Voss = disc. train jon bate (ames, wa) 
rake Cige logs = clec trein OM 5801 (erSin MES, Take) 
Cise loss totel = 10.5 ** np ن‎ 26161 (real chise loss, 


Eake dase losis) 
MONS > mo rendon mormel (0, I, Balen size, 2 eize) )) 


G loss = cull Models train on lovee (mouse, dbi) 


# Save outputs every few epochs 
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aie epoch 55 Sole samnesewell == 0; 
one_batch (epoch) 


توليد أرقام مكتوبة بخط اليد 
باستخدام مجموعة بيانات MNIST‏ يمكننا إنشاء دالة مساعدة لإنشاء تنبؤات لمجموعة من الصور 
باستخدام المولد. تقوم هذه الدالة بتوليد صوت عشوائي» وتزويده للمولد. وتشغيله لعرض الصورة التي 
تم إنشاؤها وحفظهاني مجلد خاص. يوصى بتشغيل هذه الدالة المساعدة بشكل دوري» مثل كل 200 
دورة» لمراقبة تقدم الشبكة. التنفيذ أدناه: 


def one batch (epoch): 


i, GCG — 5, 9 

MON SO mocel = كرض‎ seelavclomlsivoncnelI (0; il, (2 ** CG, 2 22 
gen images = gen.predict (noise model) 

f Rescale images 0 - 1 

gen images = gen images*(0.5) + 0.5 


itae, aks = ple- Sulsjollores (i, ©) 
cnt = 0 
OE aL im rangele) 8 
OE J im rangele) e 
exellii [| -1mshow (Cen meges leme, 7 lly 
cmap='gray') 

BUS) [355 3) ]| seats OEE) 

Quo «e d 
fig.savefig("images/$d.png" $ epoch) 
plt.close() 


تقدم التدريب» قمنا Lis‏ الصور التي تم إنشاؤها كل 200 فترة وقمنا بتخزينهاني مجلد مخصص 


“Images” يسمى‎ 


Ciee, Gen, CULL model = imeiedize moceli) 
train(epochs-10000, batch size-32, sample interval-200) 


& 3 400 «initialization مراحل مختلفة: التهيئة‎ GAN دعونا نتفحص نتائج محاكاة‎ (OVI 
فترة» والنتيجة النهائية عند 10000 فترة.‎ 0 


في البدايةء نبدأ بالضوضاء العشوائية random noise‏ كمدخل للمولد. 
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2 EE 
t 
is 
a 


ree 5 

7 + 
1 Do 0 
A7 


الرغم من أن الصور التي تم إنشاؤها 


5 


بعد التدريب لمدة 5000 فترةء يمكننا أن نلاحظ أن الأرقام الناتجة بدأت تشبه مجموعة بيانات 
.MNIST‏ 
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أكمل 10.000 فترة تدريب ALIS‏ نحصل على المخرجات ASS‏ 


"SSIS 
nam 


EEG 
75585 
v T e s [- 
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تشبه هذه الصور التي تم إنشاؤها إلى حد كبير بيانات الأرقام المكتوبة بخط اليد لتدريب الشبكة. من 
المهم ملاحظة أن هذه الصور ليست جزءًا من مجموعة التدريب وتم إنشاؤها بالكامل بواسطة الشبكة. 
الخطوات التالية 

الآن بعد أن حققنا نتائج جيدةفي إنشاء صور GAN‏ هناك العديد من الطرق التي يمكننا من خلالها 
تحسينها.في نطاق هذه المناقشة. قد نفكرفي تجربة معلمات مختلفة. وفيما يلى بعض الاقتراحات: 


x! 


e‏ استكشف قيمًا مختلفة لمتغير المساحة الكامن z size‏ لمعرفة ما إذا كان يزيد من الكفاءة. 

eae Ls زيادة عدد فترات التدريب إلى أكثر من 10000 إن اغف هذه التذريي أو‎ e 
ثلاث مرات قد تكشف عن نتائج محسنة أو متدهورة.‎ 

o‏ حاول استخدام مجموعات بيانات مختلفة مثل MNIST‏ للأزياء أو MNIST‏ المتحرك. 
نظرًا OY‏ مجموعات البيانات هذه لها نفس معمارية MNIST‏ فقم بتعديل التعليمات 
البرمجية الموجودة لدينا. 

e‏ فكرفي تجربة معماريات بديلة مثل DCGAN; CycleGun‏ وغيرها. قد يكون تعديل دوال 
المولد والمميز كافياً لاستكشاف هذه النماذج. 


ومن خلال تنفيذ هذه التغييرات» یمکننا تعزيز قدرات شبكات GAN‏ واستكشاف إمكائيات جديدةفي 
توليد الصور. 


تشبه هذه الصور التي تم إنشاؤها إلى حد كبير بيانات الأرقام المكتوبة بخط اليد والتي يتم استخدامها 
لتدريب الشبكة. هذه الصور ليست جزءًا من مجموعة التدريب وتم إنشاؤها بالكامل بواسطة الشيكة. 
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eiiis 
على قواعد البيانات‎ ely للتعلم الآلي 528 على إنشاء صور جديدة‎ bg نموذجا‎ GAN باختصار. يُعد‎ 
بسيطة باستخدام مكتبة‎ GAN الموجودة.في هذا البرنامج التعليمي» أظهرنا كيفية تصميم وتدريب شبكة‎ 

.MNIST obh كمثال وقاعدة‎ 17 


o‏ يتكون GAN‏ من عنصرين مهمين: المولدء وهو المسؤول عن توليد صور جديدة من 
المدخلات العشوائية. والمميزء الذي يهدف إلى التمييز بين الصور الحقيقية والمزيفة. 

e‏ نجحنا من خلال عملية التعلمفي إنشاء مجموعة من الصور التي تشبه إلى حد كبير الأرقام 
المكتوبة بخط tl‏ كما هو موضحنفي الصورة النموذجية. 

e‏ لتحسين أداء «GAN‏ نقدم مقاييس مطابقة ودوال الخطأ التي تساعدفي التمييز بين الصور 
الحقيقية والمزيفة. من خلال تقييم شبكات GAN‏ على البيانات غير المرئية واستخدام 
المولدات» يمكننا إنشاء صور جديدة لم يتم رؤيتها من قبل. 

e‏ بشكل le‏ توفر شبكات GAN‏ إمكانيات مثيرة للاهتمامني توليد الصور ولديها إمكانات 
كبيرة للعديد من التطبيقات مثل التعلم الآلي والرؤية الحاسوبية. 


المصدر: 


https://www.analyticsvidhya.com/blog/2023/06/using-gans-in-tensorflow- 


generate-images/ 


152 تلوين الصور بالأبيض والأسود باستخدام شبكة الخصومة 
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8) توليد وجه الأنمي باستخدام شبكات الخصومة التوليدية 
Anime Face Generation using Generative Adversarial‏ 


Networks 
Generative adversarial networks أصبحت شبكات الخصومة التوليدية‎ 6 SI في السنوات‎ 
خاصة لتوليد الصور.‎ «artificial data شائعًا للغاية لتوليد بيانات اصطناعية‎ Goo You (GAN) 


كثير من الناس يحبون الرسوم المتحركة الأنمي anime characters‏ ويريدون أن يكون لديهم 
شخصيات أنمي مخصصة خاصة بهم. لكن إنشاء شخصيات الأنمي يحتاج إلى مهارات رسم وتصميم 
احترافية لا يستطيع الجميع القيام بها. من المهم أن يكون لديك طريقة لإنشاء وجوه أنمي بدون مهارات 


Ad 


سأشرح اليوم كيفية بناء نموذج GAN‏ لإنشاء صور وجوه لشخصيات الأنمي. 


ماهو *GAN‏ 
تعد شبكات الخصومة التوليدية (GAINS)‏ من تقنيات التعلم الآلي الشائعة والقوية المستخدمةفي إنشاء 
الصور والنصوص والفيديو والصوت. منذ تقديم أول شبكة 6.817 في عام 2014( تطور مجال البحث 

هذا بسرعة» ويظل أكثر معمارية الشبكات العصبية المستخدمة اليوم مرونة. 
يتم تصنيف GAN‏ ضمن التعلم غير الخاضع للأشراف. وهذا هو أحد الأسباب الرئيسية التي دفعت 
الكثير من الباحثين إلى تنفيذ عملهم باستخدام النماذج التوليدية -generative models‏ 

eos 5 Jiu . LL 6 1 ^ GAN po e ..‏ لتر 1 لتوليد بيانات جديدة, .. المولد 

-Discriminator والمميز‎ Generator 

ماذا تفعل الشبكة العصبية للمولدات؟ 
تقوم الشبكة العصبية للمولدات بإنشاء البيانات الاصطناعية (عينات مزيفة (fake samples‏ باستخدام 
ضوضاء عشوائية .random noise‏ 
ماذا تفعل الشبكة العصبية للمميزات؟ 
تعمل الشبكة العصبية للمميزات كمصنف ثنائى وتصنف عينة الإدخال على أنها حقيقية real‏ أو مزيفة 
fake‏ 


154 شبكات الخصومة التوليدية 


من المهم الحصول على بيانات جيدة للحصول على نتائج جيدة. 


في هذا المشروع» أستخدم مجموعة بيانات الصور العامة الخاصة ب Anime Face .Kaggle‏ 
.Dataset NTU-MLDS‏ 


تتكون مجموعة البيانات من 36740 صورة عالية الجودة لوجوه الأنمي. جميع الصور هي صور ملونة 
بحجم 64 x‏ 64 بكسل. 
قبل البدء لنقم بتنزيل مجموعة البيانات باستخدام -Kaggle API‏ 


def download data(): 
kaggle.api.authenticate() 
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kaggle.api.dataset download files('lunarwhite/anime- 
face-dataset-ntumlds', path='./', unzip-True) 
download data() 


إذا لم تكن على دراية بتنزيل بيانات e 36 Kaggle‏ هذه الخطوات. 


إضافة الصور إلى القائمة وتصور الصور. 


from 211 import Image 

import random 

import glob 

image TSE = [f] 

rows = [] 

forest lenane im globe GES Lima dE SE Joet] E 
im=Image.open (filename) 
rows.append([filename]) 
image list.append(filename) 

print (len (image list) ) 

def gallery(array, ncols=8): 
nindex, height, width, intensity = array.shape 


nrows = nindex//ncols 

assert nindex == nrows*ncols 

result = (array.reshape(nrows, ncols, height, width, 
intensity) 


. Swapaxes (1,2) 
.reshape(height*nrows, width*ncols, 
intensity)) 
return result 
def make array(): 
arr = [] 
# Randomly select 64 images to visualize 
for i in range(64): 
random image = random.choice(image list) 
arr.append(np.asarray( 
Image.open(random image).convert('RGB') 
)) 


return np.array (arr) 


array = make array() 
result = gallery (array) 
plt.figure(figsize-(8,8)) 
plt.imshow (result) 
plt.show () 


المعالجة المسبقة وتحميل البيانات 
تعد المعالجة المسبقة للبيانات Data preprocessing‏ إحدى المهام الرئيسية للتأكد من أن البيانات 
مناسبة لتدريب النموذج. 


شبكات الخصومة التوليدية 


MI‏ قص كل صورةفي المركز وقم بتغيير حجم الصورة إلى 64 مع الاستيفاء الثنائي الخطي» ثم حول 
الصورة بنطاق بكسل ]255 ,0[ إلى كائن tensor‏ وأخيرًا قم بتحويل الصور إلى قيم متوسط الصورة 
هو 0.5 والانحراف المعياري للصورة هو 0.5. سيؤدي هذا إلى تسوية الصورةفي النطاق [1 ,1-]. 


df = pd.DataFrame (rows) 
df.to csv('data.csv', index-False, header = None) 


# Preprocessing 

#The batch size is defined based on the memory of GPU or 

CRU. 

batch size = 128 

SEES = (0.5, 0-5; 0-5); (0.5, 0.5, 05.5) 

transform = transforms.Compose([transforms.CenterCrop (64), 
transforms.Resize(64, 


interpolation=2), 
transforms.ToTensor(), 


transtorna NOEMa ize SEES) I) 
def denorm(img tensors): 
ECEUEN TMS EERSOES = Sees I Ol] ar Site ate SAO] ro 


# loading data 
class AnimeData (Dataset): 
Wrap the data into a Dataset class, and then pass it to 
the DataLoader 
8. imit — 9 Imitializetion Cata 
: (ena. : SUOCOEE the RIESE guch that 2ك‎ 22 Sek [Lat | 
can be used to get ith sample 
B iem 8 certcn the size (Qu the Caraseto 
det init (Seli, root; transtorm-None)!; 
self.frame = pd.read_csv(root, header=None) 
self.transform = transform 


oleic _ len _ (eel) 
return len(self.frame) 


de mec cem (selt, molex) s 
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image mame = لمعه‎ rreme aloe rades, Ol 
image = Image.open(image name) 
image = self.transform (image) 


return image 


trainset = AnimeData(root='./data.csv', transform=transform) 
trainloader = Dataloader(trainset, batch size, shuffle-True, 
num workers-0) 


حدد مجموعة البيانات (AnimeData)‏ وقم بتحميل صور التدريب باستخدام .DataLoader‏ 


التحقق من توفر GPU‏ ونقل البيانات 
نحن هنا نتحقق مما إذا كانت وحدة معالجة الرسوميات (GPU)‏ للكمبيوتر متاحة وننقل البيانات إلى 
GPU‏ (أو وحدة المعالجة المركزية (CPU‏ 


استخدم GPU‏ لتسريع البرنامج. 


LE COCA Cuda ies eveailable()s 
device-torch.device('cuda') 

else: 
device=torch.device('cpu') 


GAN تعريف‎ 

وهنا الجزء المهم !!! 

معمارية الشبكات العصبية 

كما ذكرنا أعلاه» تحتوي معمارية GAN‏ على شبكتين عصبيتين تلافيفيتين عميقتين لتوليد الصورء 
(JJ ga s‏ ومميز. وباستخدام الضوضاء کمدخل»› يقوم نموذج المولد بإنشاء صور "مزيفة fake‏ . 


j ~ d N 
/ rd Hout Layer 5 Fa Ne inpet Layer 
ComTeazpose Laver \ | i / Comvotubenai Layer \ * 
j 4 Hidden Layer 1 j 1 i = 
ودج ممه‎ 
| BatceNom i Hadden Layer 2 
i Hisna Lie 2 | 1 / 5 
\ ReLU / 01 \ Lear ReLU Jd Hidden Layee 3 
EN rome Layer 3 XxX E i * 
1 s E i CorvTrasposa Layer 
Com Tratpose Layer 
* 
* 
Generator Tae Dtscrmanator rage 


في هذا المشروع» أستخدم ÉJ y‏ يحتوي على 5 طبقات تلافيفية منقولة transpose convolutional‏ 


layers‏ وسوف يقوم بأخذ عينات من المدخلات ويتعلم Las‏ ملء تفاصيل الصورة أثناء عملية 
التدريب. 
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تم استخدام تسو ية الدفعات Batch normalization‏ نموذج المولد لتوحيد standardize‏ 


المدخلاتفي الطبقات. 
تم استخدام Ilə‏ تنشيط الوحدة الخطية المصححة 3Rectified linear unit (ReLU)‏ كل ib‏ 


إخراج المولد هو الصورة الجديدة بنفس الحجم BLS‏ عينات بيانات x 64 x 64 sey‏ 3. 


# Create your Generator model 
latent size = 12$ 
class Generator (nn.Module): 
cet _ umie (eelt, latent $3.99) 8 
super (Generator; Selz) o imie  () 
Initialize the Generator Module 
param lersne Size: Ths lengi CE the imour Latene 
VICE EOE 
SOLE -Comy blockii = DM. Secuencia ( 
nn.ConvTranspose2d(in channels-latent size, 
Ott channelgssl2, kernel Size, SENI, peclhing=0); 
nn.BatchNorm2d(512), 
nn.ReLU(), 
nn.ConvTranspose2d(in channels-512, 
(he Channelg=256;, kernal size=4, SCO, pacdhng=L); 
nn.BatchNorm2d(256), 
nn.ReLU(), 
nn.ConvTranspose2d(in channels-256, 
OulERchammeles 11237 kernal size=4; SEAS 77. pPacdhingo=L); 
nn.BatchNorm2d(128), 
nn.ReLU(), 
nn.ConvTranspose2d(in channels-128, 
out channels-64, kernel size-4, stride-2, padding-1), 
nn.BatchNorm2d(64), 
nn.ReLU(), 
nn.ConvTranspose2d(in channels-64, 
Gur كلك‎ nme HS sl, kernel aber. ertrice=z2; Bad) 
nn.Tanh() 


) 


def forward(self,x): 
Forward propagation of the neural network 
:param x: The input to the neural network 
:return: A 3x64x64 Tensor image as output 
x = gelr Cony blockii H) 
EEE UE 3€ 
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G-Generator(latent size).to(device) 
# random latent tensors 


MOLES = للك 22 مم‎ randa (delice size, lateme Size; Il, 1) 
# use generator model to generate fake imag 
fake images = G(noise) 


fvisualize the fake images by function show images 


def show images(images, nmax-64): 

fig, ax = plt.subplots(figsize-(8, 8)) 

eben seeks (I)? ex ser vacsiebss (CIT 3) 

ax.imshow(make grid(denorm(images.detach()[:nmax]), 
nrow-8).permute(1, 2, 0)) 


show images(fake images) 


iens eal meges abet ا‎ (eszeabaubexerelex)) B 
real images-(real images).to(device) 


show images(real images) 
تم استخدام تسوية الدفعات للطبقات‎ yell على 5 طبقات تلافيفية. على غرار‎ Cad Fl يحتوي‎ 
sigmoid ودالة التنشيط‎ LeakyR eLU المخفية ودالة تنشيط‎ 


مدخلات المميز هي 64 X 64 x‏ 3 صور موترء ويعطي المميز قيمة واحدة كمخرجات تشير إلى ما I]‏ 
كانت الصورة المعطاة مزيفة أم لا. 


# Create your Discriminator model 
class Discriminator (nn.Module): 
Cet — agam SELE, meieannels) 8 
SUSE (Da ست د‎ imine tor; Sel) , imirt ( 


nun 


Initialize the Discriminator Module 
:param inchannels: The depth of the first 
convolutional layer 
exer Cony Idilo@lel = mn. SECON LEN ( 
nn.Conv2d(in channels-3, out channels-64, 
kernel SA ze, Etr icde=2; PACA b) ن‎ 
nn.BatchNorm2d(64), 
nn.LeakyReLU(0.2, inplace = True), 
nn.Conv2d(in channels-64, out channels-128, 
kernel aired. Stride=2; PASO), 
nn.BatchNorm2d(128), 
nn.LeakyReLU(0.2, inplace = True), 
inim. Conven Ciannels=lz26, (be Channsle=236,; 
kemmel SI zê, SEIS, ACO), 
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iMiN EAECEANGSEMZ AZ SO) 

nn.LeakyReLU(0.2, inplace = True), 

nn Conv2 cl كنك‎ CREME SS SO, Oue Cemal SEZ, 
kernel fare. SEIS, jerevelolaliave—1L)) 7, 

nn.BatchNorm2d(512), 

nn.LeakyReLU(0.2, inplace = True), 

was COVA Chicsiainsls=Sil2, out Cliciaimeils—Il , 
kemmel SI z4, SECIS, paceking=0) 7; 

| )0( ترك ع عات mae El‏ 

nn.Sigmoid() 


) 


def 10 21324 (Seis x): 


nun 


Forward propagation of the neural network 

:param x: The input to the neural network 

:return: Discriminator logits; the output of the 
neural network 


nun 


x = gelr Conv blockii (ox) 
TOTUM z 


D=Discriminator (3) .to (device) 
الخطأ وخوارزمية التحسين والمعلمات الفائقة‎ Ula 
يتم تدريب شبكات المولدات والمميزاتفي وقت واحد. يتم حساب خطأ كلتا الشبكتين العصبيتين‎ 
mean squared error (MSE) باستخدام دالة خطأ الخطأ التربيعي المتوسط‎ 


الممحسّنات Optimizers‏ هي طرق تُستخدم لتغيير سمات الشبكة العصبية مثل الوزن weight‏ ومعدل 
التعلم (3.learning rate‏ التجربة FAR‏ استخدمت محسن Adam‏ لكل من الشبكات العصبية 
المولدة والمميزة ذات معدل التعلم. betals‏ (معدل الانحلال الأسي second-moment‏ 
estimates‏ لتقديرات اللحظة الأولى Juss) beta2s «(exponential decay rate‏ الانحلال el‏ 
exponential decay rate‏ لتقديرات اللحظة الثانية (second-moment estimates‏ والمعلمات 
الفائقة -hyperparameters‏ 


# Create optimizers for the discriminator D and generator G 
# Define your learning rate 


2-072 

opt Cl = optim- Acem (D paremeceral), Miele, Bela (0,5, 

0. 999(7 

Gort G = Optim. ACEM (E. OA MOLES, ICI, berceas= (0:5; 
) 


0.999) 


8( توليد وجه الأنمي باستخدام شبكات الخصومة التوليدية 161 


لقد وجدت أن النموذج يحقق أفضل أداء بقيم 0.0002. 0.5. 0.999 لمعدل cbetaly lall‏ 
beta2s‏ للمعلمات الفائقة على التوالي. لقد استخدمت حجم دفعة يبلغ 128 و40 فترة (تكرارات) 
لتدريب النموذج. 


يمكنك ضبط النموذج باستخدام قيم معلمات فائقة مختلفة. 


عملية التدريب 

تدريب الشبكات العصبية عن طريق تغذية النماذج بالصور المعالجة مسبقاً. لقد استخدمت 40 GLS‏ 
في مراحل التدريب. 

تدريب المميز 


النماذج المدربة بدلا من US‏ بدءا من المميز. قم بتغذية الصور الحقيقية للمميز وحساب الخطأ 
الحقيقي real loss‏ 


ثم قم بإنشاء صور مزيفة عن طريق تغذية المولد بالضوضاء ثم قم بتغذية مخرجات المولد إلى المميز 
وحساب الخطأ المزيف fake loss‏ 
الخطأ الإجمالى للمميز تقاس على النحو التالى؛ 

Total loss - real loss + fake loss 
الخطأ الإجمالى تتكون من خطأين. الأول هو اكتشاف الصور الحقيقية على أنها حقيقية والثانى هو‎ 
اكتشاف الصور المزيفة على أنها مزيفة. تم حساب الدرجات الحقيقية والمزيفة باستخدام متوسط‎ 
مخرجات المميز.‎ 


loss ta = TOTON nn م‎ 11515168) 
def Real loss(preds,targets): 
tre 
Calculates how close discriminator outputs are to 
being real. 
param, D_out: discriminator logits 
return: real loss 
tre 
berca Cisti = 
torch.distributions.beta.Beta(1,5,validate args-None) 
label noise - 
beta distr.sample(sample shape-targets.shape).to(torch.devic 
e (device)) 
loss= loss fn(targets,preds-label noise) 
return loss 


der Fakes 1088 (Prade; Targeta) 
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Calculates how close discriminator outputs are to 
being fake. 
param, D out: discriminator logits 
return: fake loss 
EEN 
bera Cieri = 
torch.distributions.beta.Beta(1,5,validate args-None) 
label MOSS = 
beta distr.sample(sample shape=targets.shape) .to(torch.devic 
e (device) ) 
loss= loss fn(targets,predst+label noise) 
return loss 


تدريب 2J9.oJl‏ 
لتدريب المولد. قم بإنشاء صور مزيفة عن طريق تغذية المولد بالضوضاء. ثم حاول خداع المميز 
باستخدام دالة الخطأ الحقيقية (نفس دالة الخطأ الحقيقية التي استخدمناها لتدريب Geel‏ 


حفخ Jl‏ 
احفظ الصور التي تم إنشاؤها ونماذج المولدات والمميز (إذا كنت تريد)في كل فترة تدريب. تم حفظ 
خطأ المولد وخطأ المميز والنتيجة الحقيقية والنتيجة المزيفةفي كل فترة وأخيرًا رسم خطأ المولد وخطأ 

المميزفي نفس الرسم البياني. 


##Define your save path. 
semple Chie = generates 
os.makedirs(sample dir, exist ok-True) 
def save samples(index, latent tensors, generator, 
show-True): 
fake images = generator(latent tensors) 
fake fname = 'generated-images- 
{0:0=4d}.png'.format (index) 
save image (denorm(fake images), os.path.join(sample dir, 
fake fname), nrow=8) 
print('Saving', fake fname) 
if show: 
fig, ax = plt.subplots(figsize-(8, 8)) 
ينه‎ SEE seeks [EI g- ex sert reales) (IET) 
ax.imshow(make grid(fake images.cpu().detach(), 
nrow-8).permute(1, 2, 0)) 
plt.show () 
EEO larent = COC. جلك تس‎ (Ot, learene mue, i, 1, 
device=device) 


losses g = f] 
losses & = [i 
real scores = [| 


fake scores 


[] 
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cer traint; (er. rel optimizer, G Oprimizer, د دانم‎ B 
icer coume = Q 
SEE E ache 
for epoch in range (epochs) : 
for real images in tqdm(trainloader): 
real images-real images.to(device) 


f Pass real images through discriminator 


D out real = D(real images) 

EEN reell = OEM. UNL (Up) ott Sell, shepe, 
OE (torch م ا‎ (device) ) 

read loss = Real lVoss(label real, D out real) 

real SEES = EOC MOAR (BD our eats -iws 

# Generate fake images 


DOLGE = TO CM renca (lsetecla size; LECE S12; ily 
1) .to(torch.device (device) ) 
rake meges = Gnose) 


# Pass fake images through discriminator 
D out fake = D(fake images) 
label fake COCH o SULD SUE EES, sin ap ey, 
0) s 1e (eese ela لك لبك )عت السك‎ ) 
take logs = Welds lose(lebel take; D owt teks) 
fake score = torch.mean(D_ out fake) -1tem() 


# Update discriminator weights 
loss Gl = TIAL loss sr take losis 


Gl OSE MIZE EEO _ GE AC (() 
loss d.backward(retain graph - True) 
d optimizer.step() 


# Generate fake images 


MONS, = 6 626117 renc loete Silke, larcent size; il, 
1) .to(torch.device (device) ) 
fake images2 =  G(noise2) 


Gen Straps = 1 

EOE 3r im 1222062 (Op, gen SEES )s 

# Try to fool the discriminator 
D GUE takez = Di(take images?) 


# The label is set to l(real-like) to fool 
the discriminator 

lebel reall = 
1.0).to(torch.device (device)) 

loss g = Rol LOSS (LASSEN reall, D whe ieee) 


TOCH TULL (D Our rele 2 ehee; 


# Update generator weights 
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g optimizer.zero grad() 
loss g.backward(retain graph = (i«gen steps 


g optimizer.step() 


losses g.append(loss g.item()) 

losses d.append(loss d.item()) 

real scores.append(real score) 

fake scores.append(fake score) 

# Log losses & scores (last batch) 

prine (Udmexoeln (thi til, less gs (8.455), loss cl 
[Sadi real seores {SoG}, TEKS 836861288 (9943 ]" soleus ( 

EOC, epochs, logs €, loss cl, real score; 
fake score)) 


# Save generated images 
save samples(epoch+start idx, fixed latent,G, 
show-True) 


Stace chis = ("chs waoelel "s Dosicaice chicc(), "ejes" 


epoch} 
srarce Gen = ("gen MOSEL: 888293 CIEE, "epoch! 8 
epoch} 
IIE MOK OS PACER o altere latre ) Claselgooalimic!)) E 
os.mkdir('checkpoint') 
icone للك‎ SEVE (seas Cis, 
"checkpoint/'+'D _'+str(epocht+1)) #each epoch 
Toreh Save )) 815 2185 Gen, 
"checkpoint/'+'G '+str (epoch+1)) #each epoch 


#Train the GAN 
train (D,G,opt_d,opt _g,epochs='5) 


## Visualize your loss curve of D and G 

iil, عه‎ = jolie. Sulojoloce () 

ple plor (LOSES c lIlelxsil="ascicsimmecee’, esie). 5) 
jolie Plor Closses cl, ligo Generator"; eulos. 5) 
plt.title("Training Losses") 

plt.legend() 


بعد انتهاء التكرارات التدريبية الأولى أو الثانيةء سترى وجوه الأنمي تظهرني النتائج. سيؤدي كل MSS‏ 
إلى تحسين أداء النموذج. 

الصور المولدة 

هذه بعض pall‏ التي تم إنشاؤها من نموذج GAN‏ الخاص بي بعد 40 فترة. قريبة جدا أليس كذلك؟ 
يمكنك تحسين هذه الصور عن طريق ضبط معلمات النموذج. 


€ v VS i EM) 
Y. ADs. A R 
0 i E TISTE S 
ETERA n A. 


لقد قمت OV‏ بإنشاء شخصيات الرسوم المتحركة (الانمي) الخاصة بك!!! 
يمكنك العثور على الكود الكامل هنا. 
المصدر: 


https://aihalapathirana. medium. com/generative -adversarial-networks- 
for-anime-face-generation-pytorch- 1b4037930e21 
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Fake Face Generation Using GAN‏ 


في المقالة التالية» سنقوم بتعريف وتدريب نموذج شبكة الخصومة التوليدية الالتفافية العميقة Deep‏ 
Convolutional Generative Adversarial Network(DCGAN)‏ على مجموعة بيانات من 
ge‏ الهلاك cnl‏ من gh ip ga‏ فك de peo ad Coll yall‏ رج Ara pta‏ 
تبدو واقعية قدر الإمكان. 
للقيام Uo‏ سنحاول أولاً فهم الحدس وراء عمل شبكات GAN‏ وشبكات DCGAN‏ ثم دمج هذه 
المعرفة لبناء نموذج مولد الوجه المزيف Fake Face Generator Mode‏ . بحلول نهاية هذه المقالة 
ستكون قادرًا على إنشاء عينات مزيفة على أي مجموعة بيانات معينةء باستخدام المفاهيم الواردةفي هذه 
المقالة. 
المقالة التالية مقسمة إلى قسمين: 

.Pytorch التطبيق: تنفيذ مولد الوجه المزيففي‎ e 


هذه المقالة سوف تغطى كلا القسمين. لذلك دعونا نيدأ الرحلة.... 


النظري 


Training set Discriminator 


NN 
جا‎ Real 
=> n EE دع‎ 


Random 


Generator Fake image 


معمارية شبكة الخصومة التوليدية (GAN)‏ 
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التعريف 

يمكن تعريف شبكات GAN‏ بشكل عام على أنها نموذج توليدي generative model‏ يتيح U‏ إنشاء 
صورة كاملة بالتوازي. إلى جانب عدة أنواع أخرى من النماذج التوليديةء تستخدم شبكات GAN‏ دالة 
قابلة للتفاضل differentiable function‏ تمثلها شبكة عصبية كشبكة المولد Generator‏ 
.Network‏ 


شبكة المولد 

ist‏ شبكة المولد Generator Network‏ الضوضاء العشوائية random noise‏ كمدخل» ثم تقوم 
بتشغيل الضوضاء من خلال الدالة القابلة للتفاضل (الشبكة العصبية) لفحويل الضوضاء وإغادة تشكيلها 
للحصول على معمارية يمكن التعرف عليها مشابهة للصور الموجودةفي مجموعة بيانات التدريب. يتم 
تحديد إخراج المولد من خلال اختيار الضوضاء العشوائية المدخلة. يؤدي تشغيل شبكة المولدات عبر 
عدة ضوضاء مدخلات عشوائية مختلفة إلى الحصول على صور مخرجات واقعية مختلفة. 


الهدف النهائي للمولد هو تعلم توزيع مشابه لتوزيع مجموعة بيانات التدريب BY‏ عينات من الصور 
الواقعية. ولكي تتمكن من القيام بذلك» تحتاج شبكة المولدات إلى التدريب. تختلف عملية تدريب 
شبكات GAN‏ كثيرًاء مقارنة بالنماذج التوليدية GEM‏ (يتم تدريب معظم النماذج التوليدية عن طريق 
ضبط المعلمات لتعظيم احتمالية قيام المولد بإنشاء عينات واقعية. على سبيل المثال» شبكات الترميز 
التلقائي المتغيرة .Variational Auto-Encoders(VAE)‏ من ناحية 5,7« تستخدم شبكات 
GAN‏ شبكة ثانية لتدريب المولد« تسمى شبكة المميز .Discriminator Network‏ 


شبكة المميز Discriminator Network‏ هي شبكة تصنيف أساسية c»‏ احتمالية أن تكون الصورة 
حقيقية. UU‏ آثناء عملية التدريب» يتم عرض صور حقيقية من مجموعة التدريب على شبكة المميز 
في نصف الوقت وصور مزيفة من المولدفي نصف الوقت الآخر. هدف المميز هو تعيين احتمال قريب 
من 1 للصور الحقيقية واحتمال قريب من 0 للصور المزيفة. 

من ناحية أخرى» يحاول المولد العكس» فهدفه هو إنشاء صور مزيفة» حيث يؤدي المميز إلى احتمال 
قريب من 1 (معتبرًا أنها صور حقيقية من مجموعة التدريب). ومع استمرار التدريب» سيصبح المميز 
ual‏ تيفيك الصو الحكفية dapes‏ لذ لخدام المي Jaca‏ المرلد إلى العيضين لاج 
عينات أكثر واقعية. لذلك يمكننا أن نقول أن: 

آي محسن سيتم اختياره؟ كيف يتم تحديد دالة التكلفة؟ ما المدة التي تحتاجها الشبكة 

للتدريب؟ وغيرها الكثير, والتي سيتم تناولها في القسم العملي. 
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العملي 

يتم تقسيم جزء التنفيذ إلى سلسلة من المهام Hay‏ من تحميل البيانات وحتى تحديد وتدريب شبكات 
الخصومة.في نهاية هذا القسم» ستتمكن من تصور نتائج المولد الذي تم تدريبه لمعرفة كيفية أدائه؛ يجب 
أن تبدو العينات التي تم إنشاؤها مثل الوجوه الواقعية إلى حد ما مع كميات صغيرة من الضوضاء. 


Discriminator 


)1( الحصول على البيانات 

ستستخدم مجموعة بيانات CelebFaces Attributes (CelebA)‏ لتدريب شبكات الخصومة 
الخاصة بك. هذه البيانات عبارة عن مجموعة بيانات أكثر heis‏ مقارنة ب WU .MNIST‏ نحن 
بحاجة إلى تحديد شبكة أعمق (DCGAN)‏ لتحقيق نتائج جيدة. أود أن أقترح عليك استخدام GPU‏ 
لأغراض التدريب. 


)2( إعداد البيانات 

نظرًا لأن الهدف الرئيسي من هذه المقالة هو ely‏ نموذج DCGAN‏ فبدلاً من إجراء المعالجة المسبقة 
بأنفسنا» سنستخدم مجموعة بيانات تمت معالجتها مسبقا. يمكنك تنزيل المجموعة الفرعية الأصغر 
من مجموعة بيانات CelebA‏ من هنا. وإذا كنت مهتمًا بإجراء المعالجة المسبقةء فقم بما يلي: 


e‏ قم بقص الصور لإزالة الجزء الذي لا يشمل الوجه. 
° قم بتغيير حجمها إلى 92 5 NumPy‏ بحجم .64x64x3‏ 


الآنء سنقوم DataLoader «Ub‏ للوصول إلى الصور على دفعات. 


def get dataloader(batch size, image Size, 
data dir='train/"}: 

Batch the neural network data using DataLoader 

aram Baten Size: MMe Size ene مده‎ barch, then mioe refs 
images in a batch 

sperem NE Sizes Ihe seare size Qus ths mege cewe (x 


y) 
:param data dir: Directory where image data is located 
:return: DataLoader with batched data 


nun 
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transform - 
transforms.Compose([transforms.Resize(image size),transforms 
oCenterCrop limage size) p erengtoTne o Totens I) 


dataset = datasets.ImageFolder(data dir,transform = 
transform) 


dataloader = torch.utils.data.DataLoader(dataset = 
6215256 5 62105 للكت‎ Salve = Baten Sale), SRE EE = True) 

return dataloader# Define function hyperparameters 
berch size = 256 
img size = 32$ Call your function and get a dataloader 
cellebpomenaumgplcader = getdaiasteadernbatt eh, size, mE S126) 


معلمات DataLoader‏ الفائقة: 
e‏ يمكنك تحديد أي Batch size doles‏ معقولة. 
e‏ ومع ذلك» يجب أن يكون حجم الصورة 32. سيؤدي تغيير حجم البيانات إلى حجم أصغر 
إلى التدريب بشكل أسرع» مع الاستمرارفي إنشاء صور مقنعة للوجوه. 


بعد ذلك» سنكتب بعض التعليمات البرمجية للحصول على تمثيل مرئي لمجموعة البيانات. 


def imshow (img): 


npimg = img.numpy() 

plt.imshow(np.transpose(npimg, (1, 2, 0)))4 obtain one 
batch of training images 
AEA ESS = alee (ECELE crain loader) 
images, = dataiter.next() # for no labels# plot the 


images in the batch, along with the corresponding labels 
fig = plt.figure(figsize=(20, 4)) 
plor S1 2820 
EOE MS im MO aeancgel(olote SAE 6 

az = ing acl SUDBIOL, plot SI, abri, 1 
yticks=[]) 

imshow (images [idx] ) 


de?‏ اعتبارك تحويل صور Tensor‏ إلى نوع NumPy‏ وتبديل الأبعاد لعرض By pall‏ بشكل صحيح 
tle‏ على الكود أعلاه (في Dataloader‏ قمنا بتحويل الصور إلى «(Tensor‏ قم بتشغيل هذا الجزء من 
اليناف الحم الخصول US te pow ya Jus‏ 


ARRARAME SE 
ال‎ 53 6 85 58 5 ae 


الصور تتمحور حول الوجوه 
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الآن قبل البدء بالقسم التالي (تعريف النموذج «(Defining Model‏ سنكتب 3l»‏ لتحجيم scale‏ 
بيانات الصورة إلى نطاق بكسل من -1 إلى 1 والذي سنستخدمه أثناء التدريب. السبب وراء القيام 
بذلك هو أن مخرجات المولد المنشط ستحتوي على قيم بكسلفي نطاق من -1 إلى 1ء ولذاء نحتاج 
إلى إعادة قياس صور التدريب الخاصة بنا إلى نطاق من —1 إلى 1 (في الوقت الحالي» هم Get‏ النطاق 
1-0). 


def scale(x, feature range-(-1, 1)): 

''' Scale takes in an image x and returns that image, scaled 
Wica El 222 28-1 zange OF pixel vales irom = ro l, 

This function assumes that the input x is already scaled 
Erom =L,“ UV 

# assume x is scaled to (0, 1) 

i? SEALS tO eacus range ancl recura scaled! x 

min, max — feature rang 

X = x*(max-min) + min 

eche S 


)3( تعريف النموذج 
بتعريف معمارية كل منهما. 


المميز 
هذا مصنف تلافيفي kä convolutional classifier‏ بدون أي طبقات .MaxpPooling‏ هنا هو 
كود شبكة المميز. 


Ger Cony ) 29520115 C output, kernel size strice = 2, adem = 1; 
barth norm = True) s 

layers -[] 

con = 
oli CONVE mowe Gy, Oleic, karnel Sal rs, SEE dE BASSI DRO OAS = 
False) 

layers.append (con) 


ALIE Balo MORNE: 
layers.append(nn.BatchNorm2d (output) ) 


return nn.Sequential (*layers)class 
Discriminator (nn.Module):de=t init (self, conv dim): 
Initialize the Discriminator Module 
sperem Conv Chimie Tie Cepa Cie the Tirer 
convolutional layer 
#complete init functionsuper (Discriminator, 
gelo). mit — () 


I71 
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self.conv dim = conv dim 

gelt leyst 1 = ECON (Si, CON Chiu, A, ACE MOM = False) 
self laysr 2 = conv (conv Cim, conv GAM 2,4) 78 
self.layer 3 = conv(conv dim*2,conv dim*4,4) #4 


self.fc = nn.Linear(conv dim*4*4*4,1)def 


forward(self, x): 


nw 


Forward propagation of the neural network 
:param x: The input to the neural network 


: 26 2 115لا‎ DISCEIMIRA EOE 15301 652 eNe opui OE the 


neural network 


nw 


# define feedforward behavior 

= Po leaky seed (sies layer 3L (s 
= isle ssedbb (sel layer 2 (ox 
= Po LEARY ESLU (SOLE. layers s(x 
= xo Wale (=i, SELE Cony Cra 
= self.fc(x) 

return x 


x x x MM 


تتكون المعمارية التالية من ثلاث طبقات تلافيفية وطبقة نهائية متصلة بالكامل» والتي تنتج 


Y واحداً. يحدد هذا اللوغاريتم ما إذا كانت الصورة حقيقية أم‎ logit Ley 


كل طبقة dass‏ باستثناء الطبقة الأولىء an‏ التسوية بالدفعات Batch‏ 


(conv helper function مساعد‎ dls (محددةفي‎ Normalization 


deis المتسربة كما تمت‎ RELU تنشيط:‎ 3l» استخدمنا‎ adel للوحلنات‎ Lob 


القسم النظري. 


بعد كل طبقة التفافية» يصبح الارتفاع والعرض إلى النصف. على سبيل JEJ‏ بعد عملية 


الالتفاف الأولىء سيتم تغيير حجم الصور مقاس 32X32‏ إلى 16X16‏ وهكذا. 


يمكن حساب البعد الناتج باستخدام الصيغة التالية: 


3 W. iS FE 


حيث © هو ارتفاع/طول الإخراج» W‏ هو ارتفاع/طول الإدخال» K‏ هو حجم الفلتر. P‏ هو الحشو 
Ss padding‏ هي الخطوة -stride‏ 


يعتمد عدد خرائط الميزات بعد كل التفاف على المعلمة conv dim‏ (في تطبيقي 


(conv dim = 64 
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في تعريف النموذج هذاء لم نطبق دالة التنشيط السيني Sigmoid‏ على لوجيت الإخراج final sll‏ 
output logit‏ هذا بسبب اختيار دالة الخطأ لدينا. هنا بدلا من استخدام BCE (Binary Cross-‏ 
«gold! Entropy Loss)‏ سنستخدم BCEWithLogitLoss‏ والذي يعتبر إصدارًا مستقرًا عدديًا 
من -BCE‏ يتم تعريف BCEWithLogitLoss‏ بحيث يقوم Vol‏ بتطبيق دالة التنشيط Sigmoid‏ 
على اللوجيت ثم يحسب ihal‏ على عكس BCE‏ يمكنك قراءة المزيد عن دوال الخطأ هذه هنا. 


المولد 
يجب على المولد أن يقوم بتجميع المدخلات وإنشاء صورة جديدة بنفس حجم بيانات التدريب لدينا 
3 للقيام بذلك سوف نستخدم طبقات تلافيفية منقولة. هنا هو كود شبكة المولدات. 


cder COCO (IME (ei 618 02ت‎ kernel size, ضعت‎ IOS = 2, ACG 
=, barch norm = TEE) £ 

layers = [] 

decon = 
nn.ConvTranspose2d(input c,output,kernel size,stride,padding 
bias = False) 

layers.append (decon) 


if batch norm: 
layers .append (nn.BatchNorm2d (output) ) 
return nn.Sequential(*layers)class Generator (nn.Module): 


def inie (SOLE, z lze, Conwy Chim) 8 


nun 


Initialize the Generator Module 

Baram z Size: Tie lenga OE the imone عت للا‎ 
vector, Z 

:param conv dim: The depth of the inputs to the 
*last* transpose convolutional layer 


nw 


Super (Ceneracor, لاعت‎ amie  () 

# complete init function 

gelr- EO Chim = Conwy Cim 

sel. re = min bineare S126 Cony ghe 22) 
self.layer 1 = deconv(conv dim*8,conv dim*4,4) $4 
self.layer 2 = deconv(conv dim*4,conv dim*2,4) #8 
self.layer 3 = deconv(conv dim*2,conv dim,4) #16 
self.layer 4 = deconv(conv dim,3,4,batch norm = 


False) #32 


def forward(self, x): 
Forward propagation of the neural network 
:param x: The input to the neural network 
:return: A 32x32x3 Tensor image as output 
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# define feedforward behavior 

x = Self. ke Ge) 

x = xo vlew- Ly SOLE cony CE, 2,2) 
# (batch size, depth, width, height) 

x = 15 اتطلق8 ) متلق‎ laysr LN) 

x = EOL (SOLE. eyes 2 (9) ) 

x ee Porelulgelrt layer 3) (x) ) 

LO em wenn (slic S LEME 4i (29 ))‏ = عد 

return x 


الشرح: 

o‏ تتكون المعمارية التالية من طبقة متصلة بالكامل تليها أربع طبقات تلافيفية منقولة. يتم 
تعريف هذه المعمارية بحيث ينتج عن الإخراج بعد الطبقة التلافيفية الرابعة صورة ذات أبعاد 
3 (حجم الصورة من مجموعة بيانات التدريب). 

e‏ المدخلات إلى المولد عبارة عن متجهات بطول size) z size‏ 2 هو متجه الضوضاء 


.(noise vector 


e‏ كل Abb‏ تلافيفية منقولةء باستثناء الطبقة الأخيرة» يتبعها تسوية بالدفعات (محددفي دالة 
المساعدة -(deconv‏ 


0 بالنسبة للوحدات المخفية» استخدمنا Ul‏ التنشيط .ReLU‏ 
e‏ بعد كل تبديل للطبقة التلافيفيةء يصبح الارتفاع والعرض مضاعفين. على سبيل المثال» بعد 
الالتفاف المنقول الأول سيتم تغيير حجم الصور 22إلى 4X4‏ وهكذا. 
يمكن حسابها باستخدام الصيغة التالية: 


# Padding--Same: 

Isl e ا‎ = 5 

f Padding--Valid 

ist = (E= = E ap م‎ 


حيث H‏ = حجم الإخراج. 111 = حجم HFE (JUS‏ = حجم الفلتر. 

يعتمد Lil > ote‏ الميزات بعد كل تحويل تبديل على المعلمة 0025_0110 (في تطبيقي conv dim‏ 
64 =( 

)4( تهيثة أوزان الشبكة 

للمساعدةني تقارب النماذج» قمت بتهيئة أوزان الطبقات التلافيفية والخطيةفي النموذج S)‏ على ورقة 
DCGAN‏ الأصليةء والتي تقول: تتم تهيئة جميع الأوزان من توزيع عادي مركزه صفر مع انحراف 
معياري قدره 0.02. 
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def weights init normal (m): 

Applies initial weights to certain layers in a model 
The weights are taken from a normal distribution 
with mean = 0, std dev = 0.02. 

:param m: A module or layer in a network 


Woy 


# classname will be something like: 
w Cony  Eucinmosw2c p binear , Ste. 


classname =m. class . name 
if hasattr(m,'weight') and (classname.find('Conv') != -1 or 
1125522270267 FINAN bingar) T= =1) 2 


m.weight.data.normal (0.0,0.02) 


if hasattr(m,'bias') and m.bias is not None: 
m.bias.data.zero () 


سيؤدي هذا إلى تهيئة الأوزان للتوزيع الطبيعيء المتمركز حول 0ء مع انحراف معياري قدره 0.02 
قد يتم ترك مصطلحات التحيز bias‏ إذا كانت موجودة, بمفردها أو تعيينها على 0. 


cli (5)‏ شبكة كاملة 
حدد المعلمات الفائقة hyperparameters‏ للنماذج الخاصة بك وقم بإنشاء مثيل للمميز والمولد من 
الفثات المحددةفي قسم تعريف النموذج. هنا الكود. 


def build network(d conv dim, g conv dim, z size): 

# define discriminator and generator 

D = Discriminator(d conv dim) 

G = ECEME (E Sive=4 Svs, Cony chime COM claim) si 
initialize model weights 

D.apply (weights init normal) 

G.apply (weights init normal) print (D) 

print () 

print (G) 


return D, G 


# Define model hyperparams 

d_conv_dim = 64 

g_conv_dim = 64 

a Save = 100D, (E; = bwile nervork(c cony chim, GC Comy Chim, 
2 fabae) 


عند تشغيل الكود أعلاه تحصل على الإخراج التالي. كما يصف أيضًا معمارية النموذج لنماذج المميز 
والمولد. 
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Discriminator( 

(layer 1): Sequential( 
(0): Conv2d(3, 64, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias-False) 

) 

(layer 2): Sequential( 
(0): Conv2d(64, 128, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias-False) 
(1): BatchNorm2d(128, eps-1e-05, momentum-0.1, affine-True, track running stats-True) 

) 

(layer 3): Sequential( 
(0): Conv2d(128, 256, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias-False) 
(1): BatchNorm2d(256, eps-1e-05, momentum-0.1, affine-True, track running stats-True) 


) 

(fc): Linear(in features-4096, out features-1, bias-True) 
) 
Generator( 


(fc): Linear(in features-100, out features-2048, bias-True) 

(layer 1): Sequential( 
(0): ConvTranspose2d(512, 256, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias=False) 
(1): BatchNorm2d(256, eps-1e-05, momentum-0.1, affine-True, track running stats-True) 

) 

(layer 2): Sequential( 
(0): ConvTranspose2d(256, 128, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias-False) 
(1): BatchNorm2d(128, eps-1e-05, momentum-0.1, affine-True, track running stats-True) 

) 

(layer 3): Sequential( 
(0): ConvTranspose2d(128, 64, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias=False) 
(1): BatchNorm2d(64, eps-1e-05, momentum-0.1, affine-True, track running stats-True) 

) 

(layer 4): Sequential( 
(0): ConvTranspose2d(64, 3, kernel size-(4, 4), stride-(2, 2), padding-(1, 1), bias-False) 

) 

) 


نماذج التمييز والمولدات التي تم إنشاؤها 
)6( عملية التدريب 
تشتمل عملية التدريب على تحديد دوال الخطأ واختيار المحسن وأخيراً تدريب النموذج. 
las‏ المميز والمولد 
خطأالمميز 
بالنسبة للمميز > الخطاً الإجمالي هي مجموع «(d real loss 4 d fake loss)‏ حيث d real loss‏ 
هي الخطأ التي تم الحصول عليها على الصور من بيانات التدريب d fake lossy‏ هي الخطأ التي تم 
الحصول عليها على الصور التي تم إنشاؤها من شبكة المولد. على سبيل المثال: 


iz‏ متجه الضوضاء. 

1: صورة من مجموعة التدريب. 

(6)2: الصورة المولدة. 

DG@)‏ إخراج المميز على الصورة التي تم إنشاؤها. 


DG)‏ إخراج oll‏ على صورة مجموعة بيانات التدريب. 
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Loss = real loss(DG)) + fake loss(D(G(@))) 


٠ه‏ تذكر WI‏ نريد من المميز أن يُخرج 1 للصور الحقيقية و0 للصور المزيفةء لذلك نحتاج إلى 
إعداد الاخطاء لتعكس ذلك (ضع هذا السطرفي الاعتبار أثناء قراءة الكود أدناه). 


خطأًالمولد 
سيبدو خطأ المولد متشابهة فقط مع التسميات المقلوبة flipped labels‏ هدف المولد هو جعل المُميز 
يعتقد أن الصور التي تم إنشاؤها حقيقية. على سبيل المثال: 
iz‏ متجه الضوضاء. 
(6)2: الصورة المولدة. 
:D(GG))‏ إخراج المميز على الصورة التي تم إنشاؤها. 
Loss - real loss(D(G(z)))‏ 


.fake lossy real loss إليك كود‎ 


Cet reel OSS (D? owt) s 
''"'Calculates how close discriminator outputs are to 
being real. 
param, D out: discriminator Nogits 
eue real LOSS UU 
loeuerim size = D Cle, Swe (0) 
LASSIE = Torch. mnes loeren Sig) 
Lre train onm gouls 
labels = labels.cuda() 
criterion = nn.BCEWithLogitsLoss () 
loss = cricerion(D SUE Scussze (0) p labsls) 
Eee MEN KOS SMe take LOSS (D n) B 
''"'Calculates how close discriminator outputs are to 
being fake. 
percem, D OME: تمت كك‎ 15155 0 Ihe shes 
EER saks LOSS iy 
للك ع دكا‎ size = D Owr sale (0) 
labels = rorci zeros (oare S120) 
if train on gpu: 
labels = labels.cuda() 
criterion = nn.BCEWithLogitsLoss() 
LOSS = erircerion(D out. 8404323 (0). eles) 
Ee EET LOSS 
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المحسنات 

بالنسبة لشبكات GAN‏ نحدد محسنين optimizers‏ أحدهما للمولد والآخر للمميز. والفكرة هي 
تشغيلهماني وقت واحد لمواصلة تحسين الشبكتين.في هذا التنفيذ. استخدمت محسن LIS 3A dam‏ 
الحالتين. لمعرفة المزيد عن أدوات تحسين الأداء المختلفةء راجع هذا الرابط. 


# Create optimizers for the discriminator D and generator © 


Gl Oprimizer = oprim- ACEM (D paremetsrs (0) "Jie = 0002; bercas = 
(0.3, 0.999) )) 
G _ 68 انس‎ ZS = Gorim. ACEM (CE paremetare l); dise = OOW2, beras = 
[0.5.87 09991) 


يعتمد معدل التعلم (lr)‏ وقيم by‏ على ورقة DCGAN‏ الأصلية. 


التدريب 
سيتضمن التدريب التناوب بين تدريب المميز والمولد. سنستخدم دالتي real loss‏ و fake loss‏ 
المحددتين Gale‏ لمساعدتنافي حساب اخطاء المميز والمولد. 


ثم المولد الذي يحاول خداع المُميّز ويجب أن يكون له دالة خطأ معاكسة. 
هنا هو كود للتدريب. 


cder سك صخ‎ (D, G; m دسا مهست‎ print evsry=50) 8 
'''Trains adversarial networks for some number of epochs 

param, D: the discriminator network 

param, G: the generator network 

parem, n poches Number O epoche EO train Tor 

param, print every: when to print and record the 
models' losses 

gectim: D كلك‎ € loses! V V 


# move models to GPU 
if train on gpu: 
ID euda) 
G.cuda()# keep track of loss and generated, "fake" 
samples 
samples = [] 
losses = []# Get some fixed data for sampling. These are 
images that are held 
# constant throughout training, and allow us to inspect 
the model's performance 
sample size-16 
IEG z = Np- Lamclom,Umaicoum(—l, 1; Silve=(Semple Silvey, 
z Size)) 
Eixed và الاك مع‎ EBON للم ) ا‎ 2 cae lliovenie (0) 
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# move z to GPU if available 
ai trenn Qu goug 


SG YA = Exe ZC rteepochWwb aiming leo 
for epoch in range(n epochs):# batch training loop 
iue baten a, (zeal images, _) alm 


numerate(celeba train loader):batch size - 
real images.size(0) 


real images = seale (reell mages) 
Lr wren om Gous 
real images = real images.cuda() 


# 1. Train the discriminator on real and fake 


ima.ges 

d optimizer.zero grad() 

C ote Heal Deal images) 

Z = np.random.uniform(-1,1,size = 
(bareh Silwe,% sume) )) 

z = OTOM. OM anus (4) . 2125 (() 

E wren om Gous 

z = m Cucak) 
Gl losg = real loss(c out SAL) ar 


fake loss(D(G(z))) 

d loss.backward() 

(oL OE ZE. SESS (O) 

# 2. Train the generator with an adversarial 
loss 

)(( 1ك شخ CE‏ 

g optimizer.zero grad() 

z — np.random.uniform(-1,1,size - 
(bareh ات مده‎ E sure) )) 

4 = Orla f OM DUMO (2) E OSE) 

IE EAN (Qu اس‎ 

Z = z.cuda() 

ej loss = real loss (DERE) ND 

g loss.backward() 

G Optimizer e SESS (D) 


# Print some loss stats 
ait barch al g print eyery == 
# append discriminator loss and generator 
loss 
losses.append((d loss.item(), 
Gy loss ESM) )) ) 
f print discriminator and generator loss 
joie 0) للع تمت‎ [1856/1256] || cl losss (95655455) 
| € loses (O.L FT مده كن‎ ( 
Spock, im epochs, cl LOSS, atc) y 
g loss.item()))f44 AFTER EACH EPOCH## 
# this code assumes your generator is named G, feel 
free to change the name 
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1 generate and save sample, fake images 
G.eval() # for generating samples 
samples z2 = CFS z) 
samples.append(samples 2) 
G.train() # back to training mode# Save training 
generator samples 
with open('train samples.pkl', 'wb') as f: 
pkl.dump(samples, f) 


# finally return losses 
return losses 


f set number of epochs 
n epochs = 404 call training function 
OSES = Tre (Dr رم‎ im مده جام ممت‎ poche) 


يتم تنفيذ التدريب على مدى 40 فترة epochs‏ باستخدام وحدة معالجة الرسوميات GPU‏ ولهذا 
السبب اضطررت إلى نقل النماذج والمدخلات الخاصة بي من وحدة المعالجة المركزية CPU‏ إلى 
وحدة معالجة الرسوميات .GPU‏ 


(7]النتائج 
فيما يلي مخطط اخطاء التدريب للمولد والمميز المسجل بعد كل فترة. 


Training Losses 


Discriminator 
Generator 


0 50 100 150 200 250 300 


es‏ التدريب للمميز والمولد 
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يرجع التقلب الكبيرني خطأ تدريب JE‏ إلى أن المدخلات إلى شبكة المولدات عبارة عن مجموعة 
من متجهات الضوضاء العشوائية JS)‏ منها بحجم (z size‏ يتم أخذ كل Kee‏ من توزيع موحد قدره 
)-1,1( لإنشاء صور جديدة لكل فترة. 

في مخطط المميزء يمكننا ملاحظة ارتفاعني خطأ التدريب (حوالي 50 على المحور السيني) يليه 
انخفاض تدريجي حتى النهاية» وذلك OY‏ المولد بدأفي توليد بعض الصور الواقعية التي خدعت المميزء 
ga Lae‏ إلى as ia‏ ولك بيط ومع تقدم c‏ جح اتيم o palla ja‏ اة 
والحقيقيةء مما يؤدي إلى انخفاض تدريجي في أخطاء التدريب. 


٠ه‏ العينات التي تم إنشاؤها بعد 40 فترة. 


E 3 5 SES LES 
E - 
EmEmMEISE 


إنشاء صور مزيفة 


تمكن نموذجنا من إنتاج صور جديدة لوجوه بشرية مزيفة تبدو واقعية قدر الإمكان. يمكننا Cal‏ أن 
نلاحظ أن جميع الصور تكون أفتحني الظلء حتى الوجوه البنية تكون أفتح قليلاً. وذلك OY‏ مجموعة 
بيانات CelebA‏ متحيزة؛ وتتكون من وجوه "المشاهير "celebrity‏ ومعظمها بيضاء. ومع 35« نجح 
3DCGAN‏ إنشاء صور شبه حقيقية من مجرد ضوضاء. 

رابط الكود: 


https: //github.com/vjrahil/Face-Generator 


المصدر: 
https://towardsdatascience.com/fake-face-generator-using-dcgan-model-‏ 
ae9322ccfd65‏ 
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Generating Human Face using GAN 
باستخدام شبكة الخصومة التوليدية‎ human faces في هذا المشروع. سأوضح كيفية إنشاء وجوه بشرية‎ 
والتي ربما لا تكون موجودةفي الحياة الواقعية.‎ «Generative Adversarial Network (GAN) 


شبكات الخصومة التوليدية الالتفافية العميقة (DC-GAN)]‏ 
سأستخدم شبكات الخصومة التوليدية الالتفافية العميقة Deep Convolution Generative‏ 
Adversarial Network (DC-GAN)‏ لهذه المهمة. أنا أستخدم مجموعة CelebA olly‏ 
لتدريب الشبكة. تحتوي مجموعة البيانات هذه على 2,00,000 صورة لأشخاص معروفين. أفترض أن 
لديك Ge‏ نظريًا لشبكات GAN‏ سأستخدم إطار عمل  TensorFlow‏ هذا البرنامج التعليمي. هيا 
Jis‏ 
X all a ada‏ الى سيدو بها سين العمل Ad‏ 

u‏ و الور 

2) إنشاء شبكة المولدات والمميزات. 

3( تدريب الشبكة وتوليد وجوه جديدة. 


فيما يلي بعض الصور من مجموعة البيانات لدينا. 
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تسوية الصور 
APER o‏ باستيراد المكتبات التي سنستفيد منها. 
e‏ نقوم بتحميل جميع الصور باستخدام PIL‏ أثناء تحميل الصور نقوم بقص جميع الصور 
حول الوجه وتغيير حجمها إلى (3 ,64 ,64). 
e‏ وتقع هذه الصورني حدود )255 ,0). نقوم بسحق نطاق البت لهذه الصور بين (1 C1,‏ 
والذي يقعفي نطاق تنشيط .tanh‏ 


import glob 

import numpy as np 

from PIL import Image 

import tensorflow as tf 

import matplotlib.pyplot as plt 

from tensorflow import reduce mean 

from tensorflow.train import AdamOptimizer as adam 

from tensorflow.nn import sigmoid cross entropy with logits 
as loss 

from tensorflow.layers import dense, batch normalization, 
conv2d transpose, conv2d 


image ids = glob.glob('../input/data/*') 


COS = (30. 55; 150, 175) 

images = 
[np.array((Image.open(i).crop(crop)).resize((64,64))) for i 
in image ids] 


for i in range(len(images)): 
images[i] = ((images[i] - images[i].min())/(255 - 
) 3) 


images[i]*2-1 


images [i] .min ) 
images [i] 


images = np.array (images) 

إنشاء الشبكة 
o‏ أقوم بتنفيذ DCGAN‏ هنا لأكون محددًا. وهو ما يسمى بشبكات الخصومة التوليدية 
الالتفافية العميقة. هذا هو شكل مختلف من شبكة GAN‏ القياسية التي تم تقديمهاني عام 
4 بواسطة000016110) .Ian Goo Ian‏ تستخدم cub DCGAN‏ الالتفاف 
Convolution layers‏ بدلا من جميع الطبقات المتصلة بالكامل fully connected‏ 

layers 
Generator هو أن لديها شبكتين تسمى شبكة المولد‎ GAN المفهوم الكامن وراء‎ o 
إنشاء صور واقعية المظهر من‎ Generator تتمثل مهمة المولد‎ 0 
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الضوضاء وخداع Discriminator jos!‏ ومن ناحية أخرى. فإن مهمة المميز هي التمييز 
بين الصور الحقيقية والمزيفة. يتم تدريب هاتين الشبكتين بشكل منفصل. 

e‏ في بداية كلتا الشبكتين كانتا ضعيفتينفي دوالهما ولكن مع استمرارناني التدريب» يتحسن 
المميزني التمييز بين الصور الحقيقية والمزيفة ويتحسن المولدفي توليد صورة ذات مظهر 
حقيقي بحيث يمكنه خداع المُميّز. ومع ذلك فإن مهمة تدريب GAN‏ ليست سهلة للغاية. 

o‏ تتشابه معمارية الشبكات واختيار المعلمات الفائقة GLS‏ مع تلك المستخدمةفي ورقة 
.DCGAN‏ وهي ورقة بحثية لطيفة جد تشرح كل ما يتعلق ب DCGAN‏ وأوصيك بشدة 
بإلقاء نظرة عليها. 


def generator(noise, reuse-False, alpha=0.2, training=True): 


with tf.variable scope('generator', reuse-reuse): 


= dense (noise, 4*4*512) 

= tf.reshape(x, (-1, 4, 4, 512)) 

= batch normalization(x, training-training) 
— tf.maximum(0., x) 


EX = COMMA weiss, 255, 37 2, ACCME Same) 
x = batch normalization(x, training=training) 
x = tf.maximum(0., x) 


Cowl ELEMIS, 120; Dy, 2, OCCO Semet)‏ = كد 
FX = batch normalizacion (y ELS MERG EAR IG )‏ 


x = tf.maximum(0., x) 


Es = CONYE weeiisjiosoa(<, G4, B, 2, Badd SAME) 


x = bareh normalization (x, EES ME ECA AC) 
x = tf.maximum(0., x) 
logire = CGomy2cl transpose; Sp 5, 2, 


padding='same') 
Gule = EL EAN (LOSES) 


return out, logits 
إلى المولد. يقوم المولد‎ uniformly distributed noise سنقوم بتمرير ضوضاء موزعة بشكل موحد‎ 
بتحويل هذا الضوضاء إلى صورة بحجم )3 ,64 ,64). نحن نستخدم تحويل الالتفاففي هذه العملية.‎ 
بعد طبقة الالتفاف المنقولة‎ Batch normalization layers يتم استخدام طبقات التسوية بالدفعات‎ 
بعد طبقات‎ Relu من الطبقة الأخير: ة. نحن نستخدم تنشيط‎ Yuu transpose convolution layer 
C1, لسحق نطاق البكسل بين‎ tanh التسوية بالدفعات. نقوم بتمرير صورتنا النهائية من خلال تنشيط‎ 
.1( 
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def discriminator (x, reuse-False, alpha=0.2, training-True): 
(alicia, ti عنم‎ 12015 SCONES (C "ollis esestumhioyene eue p 210833155118 


x = conv2d(x, 32, 5, 2, padding='same') 
x — tf.maximum(alpha*x, x) 


x = conv2d(x, 64, 5, 2, padding='same') 
x = batch normalization(x, training-training) 
x — tf.maximum(alpha*x, x) 


x = conv2d(x, 128, 5, 2, padding='same') 
x = batch normalization(x, training-training) 
x — tf.maximum(alpha*x, x) 


x = COZ, 256, 5p 2, jolie E" Semet) 
x = batch normalizacion (ss, EEA MCE CENE) 
x — tf.maximum(alpha*x, x) 


flatten = tf.reshape(x, (-1, 4*4*256)) 
logits = dense(flatten, 1) 
out = tf.sigmoid(logits) 


return out, logits 
يعطي المميز مخرجًا واحدا يوضح ما إذا كانت هذه‎ reall سنمرر موتر الشكل )3 ,64 ,64( إلى‎ 
الذي يسحق‎ sigmoid الصورة حقيقية أم مزيفة. نقوم بتمرير الإخراج النهائي من خلال التنشيط‎ 
من 1 يعني أن المميز تحدد الصورة على أنها صورة حقيقية‎ G الإخراج بين (0: 1). إذا كان الإخراج‎ 
وإذا كان الإخراج قريبًا من 0 فسيتم تعريف الصورة على أنها صورة مزيفة.‎ 


def inputs(real dim, noise dim): 


qnputsenredlmmttplaceholden (EE 2255527 (None, 
Beal AIM), Mame. mone reellt) 

dnputsmnosses-atteplaceholder(tsstiltoats2 (MOMS, 
noise dim), name-'input noise') 

Ee MED inpats zeal, ENSUES nolge 


# building the graph 
tf.reset default graph() 


Limone eal, APU MON Se = aliowhets (almyothe enee, 203-537 Slza) 
gen mouse, gen logics = generator (mout MOLES) 
Chie Ott real, Chis: bogircs COAL = chscriminaror (ERE FEM) 


Che out fake, dais OTIS fake — discriminator (gen morse, 
reuse=True) 


# defining losses 
shepe = chis Joys. see 
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dis LOSS teal = reduce mean (losis (loguts=diis logits reall, 
labels-tf.ones like (shape*smooth) ) ) 

iS loss take = recce mean (losis ) 26928836123 _ 185671158 traks; 
labels-tf.zeros like(shape))) 

gen loss = rectes mean (loss (logirtrese=cie Togits Teake; 
labels-tf.ones like(shape*smooth))) 

Cis loss e chis loses reall + CS loss Take 


# defining optimizers 


total vars = tf.trainable variables () 

cis vers = [vec ror yer im toral vares ii var nemelo == E || 
Gen vers = Iver tor yer in toral vare 3L varnemel®l == Tg] 
dis opt = adam(learning rate-learning rate, 
betal-betal).minimize(dis loss, var list-dis vars) 

gen opt - adam(learning rate-learning rate, 


Beale Dee aL) AED z2 e (Gen LOSS, ver USES vars) 


يتم تعريف دالتين مختلفتين للخطأ للمولد والمميز. الشيء نفسه ينطبق على المحسن. 

E 4 1 ^ JI cu Jai 

فيما يلي اختيار المعلمات الفائقة -hyperparameters‏ معدل التعلم Learning-rate‏ هو 0.0002« 
حجم الضوضاء size of the noise‏ هو 100« عامل تنعيم التسمية label smoothing factor‏ هو 
doles (0.9‏ التسرب leak parameter‏ ل LeakyR elu‏ هي 0.2 betal‏ لمحسن Adam‏ هو 0.5. 


4 hyperparameters 

betal = 0.5 

alpha = 0.2 

smooth = 0.9 

noise Size = 100 

rare = 0.0002‏ كن سنت سوك لا 

input shape = (64,64, 3) 

ه حجم الدفعة Batch-size‏ هو 128. لقد قمت بتدريب الشبكة لمدة 15 فترة epochs‏ فيما 


يلي كود التدريب. 


bacch eire = 128 
epochs = 15 


iters = len(image ids)//batch size 
gaver = tir train Sever (vear list = gen vars) 
with tf.Session() as sess: 


sess rin EE Global ara LES AMA EE A 231 (()) ) 


for e in range (epochs): 
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for i in range(iters-1): 


batch images - 
IMEC (SS) |] 12 لم192"‎ Sizes (GHL) Ba EEN size] 

barcch norse = np. rencon URI OMS L, 
SI 2= (batch Size, moase Size) ) 


SESS run (CLS opt, TES rers input iua 
barch EMI GES base MORSE: Balen norse) 

sese SUNKEN opt, Teee cliche input sals 
berch ama JES, inoue nolge barch norse) 


if i%50 == 
prime ) 55 لت‎ Asso corme leti; epochs); 
كلت 6 ضر‎ No FAM. فصاوع‎ iri, MESES) 


loses Cie = SESS. rUn (Chis Loss, impur MONIES 
batch noise, input real: batch images]) 

loss gen = gen loss- sval (imove real’: barten magas; 
input noise: batch noise]) 


jesestane (imeem. [i / {ico cH. EOCENE (EFL, 
epoche) , "'iDsLexessihnBbmenegae LOSSE El 5o." 15812185 (loss Chis); 
63532259612 bosss (8.4), corse (LOSS Gen) ) 


sample noieses amer amielomessmsst: onary (Sl l; eize=(&; 
noise size)) 
gen samples = sess.run(generator(input noise, 


reuse-True, alpha-alpha), 
reeel (hiec {input MOL SSE 
sample noise}) 


view gemolss (i. gen semplas, 2, 4, (1075)) 
plt.show() 
saver.save(sess, './checkpoints/generator.ckpt') 


فيما يلي الصور التي تم إنشاؤها بواسطة الشبكة بعد التدريب. يمكننا إنشاء صور أكثر واقعية من خلال 
جعل شبكتنا أعمق» لكن تدريب النموذج سيستغرق الكثير من الوقت. يمكننا أيضًا تعديل شبكتنا لإنتاج 
صور عالية الدقة ولكن مرة أخرى على حساب وقت التدريب. 


المصادر: 


.GAN هذه مدونة تمهيدية رائعة عن‎ e. 
.DCGAN حول‎ lm يرجى الاطلاع على هذه الورقة المفيدة‎ e 
لهذا المشروع.‎ Git-Hub فيما يلي رابط‎ e 


https://medium.com/@shiva-verma/generating-human-faces-using-adversarial- 


network-960863bc1deb 
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11( شيخوخة الوجه باستخدام شبكات الخصومة التوليدية 
Face Aging Using GANs‏ 

شبكات الخصومة التوليدية Generative Adversarial Networks‏ هي نوع من معماريات 
الشبكات العصبية العميقة التي تستخدم التعلم الآلي غير الخاضع للأشراف لإنشاء البيانات. تم تقديمها 
في عام 2014.في ورقة بحثية كتبها إيان جودفيلوء ويوشوا بينجيوء وآرون كورفيلء والتي يمكن العثور 
عليها على الرابط التالي: https: //arxiv.org/pdf/1406.2661‏ . لدی شبكات GAN‏ العديد من 
التطبيقات» Gly‏ ذلك توليد الصور وتطوير الأدوية. 


ستقدم لك هذه المدونة المكونات الأساسية لشبكات GAN‏ سوف يرشدك إلى كيفية عمل كل مكون 
والمفاهيم والتكنولوجيا المهمة وراء شبكات LS. GAN‏ سيعطيك لمحة موجزة عن فوائد وعيوب 
استخدام شبكات GAN‏ وإلقاء نظرة ثاقبة على بعض تطبيقات العالم الحقيقي. بعد فهم معمارية 
«GAN‏ سنرى كيف يتم تطبيق SGAN‏ مواجهة مشكلة الشيخوخة aging problem‏ 


Generator Discriminator 


Fake Money 


Counterfeiter prints fake money. It is labelled as fake for 
police training. Sometimes, the counterfeiter attempts to The police are trained to spot real from fake money. — 
fool the police by labelling the fake money as real Sometimes, the police give feedback to the counterfeiter 


why the money is fake. 
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إنشاء صور الموضة باستخدام شبكات الخصومة التوليدية 


ماهو SGAN‏ 
GAN‏ عبارة عن معمارية شبكة عصبية عميقة تتكون من شبكتين. شبكة المولد generator‏ 
network‏ وشبكة المميز .discriminator network‏ ومن خلال دورات متعددة من التوليد 
generation‏ والمميز «discrimination‏ تقو م کلتا الشبكتين بتدريب بعضهما البعض.» بينما تحاول 

كل منهماني الوقت نفسه التفوق على الأخرى. 


هدفهم هو إنشاء نقاط بيانات تشبه بطريقة سحرية بعض نقاط البيانات الموجودةفي مجموعة التدريب. 


الأبعاد ومقاطع فيديو وغير ذلك الكثير. 
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A‏ دعونا نلقي نظرة على نموذج شبكات GAN‏ العامة. 


Generative Adversarial Networks 


XENONSTACK 


Training Set fa Discriminator Real 
lee. nae 


Random noise 


Generator 2 image 


معمارية الشبكات الخصومة التوليدية 


ماهي شبكة المولد؟ 


تستخدم شبكة المولد البيانات الموجودة لإنشاء بيانات جديدة. ويمكنه. على سبيل المثال» استخدام 


الصور الموجودة لإنشاء صور جديدة. الهدف الأساسي للمولد هو توليد البيانات (مثل الصور أو الفيديو 
أو الصوت أو النص) من متجه أرقام تم إنشاؤه عشوائيًاء يسمى المساحة الكامنة latent space‏ أثناء 


إنشاء شبكة المولداتء نحتاج إلى تحديد هدف الشبكة. قد يكون هذا بمثابة إنشاء الصورء أو إنشاء 


النص. أو إنشاء الصوت. أو إنشاء الفيديوء وما إلى ذلك. 


ماهي شبكة المميز؟ 


تحاول شبكة المميز التمييز بين البيانات الحقيقية والبيانات التى تولدها شبكة المولد. تحاول شبكة 


المميز وضع البيانات الواردةفي فتات محددة مسبقًا. يمكنه إما إجراء تصنيف متعدد الفئات أو تصنيف 
ثنائي. بشكل ele‏ يتم إجراء التصنيف الثنائيفي شبكات GAN‏ 


Generator — 4 Discriminator 


شبكة المولد والمميزفي شبكات GAN‏ 


إنشاء صور الموضة باستخدام شبكات الخصومة التوليدية 


التدريب من خلال اللعب التنافسي في شبكات GAN‏ 
في شبكة «GAN‏ يتم تدريب الشبكات من خلال اللعب التنافسي :adversarial play‏ حيث تتنافس 
الشبكتان ضد بعضهما البعض. على سبيل المثال؛ لنفترض أننا نريد من GAN‏ إنشاء أعمال فنية مزيفة: 
e‏ الشبكة «JAM‏ المولد «generator‏ لم يسبق لها رؤية العمل الفني الحقيقي ولكنها تحاول 
إنشاء عمل فني يشبه الشيء الحقيقي. 


GENERATOR E 


z y' " 512 

1 as 

D o = AL, 
Full conv 1 


Full conv 4 


Full conv 5‏ 
تدريب المولد 
LÍ e‏ الشبكة ASKS‏ وهى شبكة المميز «discriminator‏ فتحاول تحديد ما إذاكان العمل الفنى 
Cua‏ أم p‏ 


D: Detective 


R: Real Data 


G: Generator (Forger) 
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يحاول المولد بدوره خداع المميز ليعتقد أن المنتجات المقلدة هي الصفقة الحقيقية من خلال إنشاء 


عمل فنى أكثر واقعية عبر تكرارات متعددة. 

يحاول المميّر التفوق على المولد من خلال الاستمرارفي تحسين معاييره الخاصة لتحديد المنتجات 
المزيفة. 

إنهم يرشدون بعضهم البعض من خلال تقديم استجابة من التغييرات الناجحة التي يقومون le‏ عمليتهم 
الخاصةفي كل JLS‏ 


في نهاية المطاف. يقوم المُميّز بتدريب المولد إلى النقطة التي لا يستطيع عندها تحديد العمل الفني 
الحقيقي وأي العمل الفني المزيف. 


REAL DATA 


le] Mem REAL 


B «| 4 ^w FAKE 
RANDOM 


NOISE GENERATOR 


Use this information to train the generator 


كيفية تنفيذ شبكات GAN‏ في مواد 5 شكلة aa àui Jl‏ 
هذه تعليمات حول LAS‏ تنفيذ شيخوخة الوجه باستخدام GAN‏ يعد تنفيذ شبكات GAN‏ أمرًا صعبًا 


يتم ias‏ جميع .CuDA 9.0, TensorFlow 1.12 gol SI‏ ننصحك بالتشغيلفي بيئة 
.Python‏ 


تثبيت 9.0 Cuda‏ )48 يستغرق ذلك بضع دقائق) 


إنشاء صور الموضة باستخدام شبكات الخصومة التوليدية 195 


$wget 
https://developer.nvidia.com/compute/cuda/9.0/Prod/local ins 
tallers/cuda-repo-ubuntul1604-9-0-1ocal 9.0.176-1 amd64- 
deb$dpkg -i cuda-repo-ubuntul604-9-0-local 9.0.176-1 amd64- 
debSapt-key add /var/cuda-repo-9-0-10cal/7fa2af80.pubS$apt- 
get updateSapt-get install cuda-9.0.176-1 


«TensorFlow cJ‏ قم بتشغيل الأمر T‏ التيرميئال: 


pip install --upgrade tensorflow-gpu--1.12.2 
استنساخ هذا الريبو:‎ 


git clone https://github.com/pbaylies/stylegan-encoder\cd 
stylegan-encoder 
إعداد هيكل المجلد لصورنا:‎ 


rm -rf aligned images raw imagesmkdir aligned images 
raw images 


cJ JALU تحضير الصور‎ 


ضع صورك التي ترغبفي تغييرهاني المجلد Raw images‏ وستكون هيكل البيانات على النحو 
التالى: 
./raw images‏ 


[your images shoule be here] 
[your images should be here] 


محاذاة الوجوه تلقائيًا 


تشغيل السكريبت: 


python align images.py raw images/ aligned images/ -- 
output size-1024 


apa dese gl ge t 
من الور‎ agli al 

قم بمحاذاة الوجوه. 

قم بإعادة قياس الصور الناتجة وحفظهاني مجلد Aligned images"‏ 


RON 


ترميز الوجودفي المساحة الكامنة ل StyleGAN‏ 


Sgdown https://drive.google.com/uc?id-1aT59NFy9- 
bNyXjDuZOTMl10qX0jmZc6ZbS$mkdir data$mv finetuned resnet.h5 
data$rm -rf generated images latent representations 
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تدريب الترميز الكامن 


$python encode images- PY --optimizer-adam --1r-0.002 -- 
decay rare=0:95 — decay Shesj9sE wie Li penalrty=0.3 == 


tace magk=rrue —iteretions=500 =-early stopping=ralsge =-= 
carly 5 2 هرمت‎ 2126 whicssliolc=0) 05 —aysregs best OSS O o == 
Use lpips lose=0 —-use Cigeriminator lloss=0 == 


output video-True aligned images/ generated images/ 
latent representations/ 


قم بالوصول https://drive.google.com/drive/u/1/folders/1exoCSLE- “at‏ 
11-7 971717 وقم بتنزيل هذه الملفات المدربة مسبقاً: 


ضع هذه الملفاتفي نفس المجلد. 
احفظ latent representations 3outout vectors.npy‏ بواسطة السكريبت. 


$python save latent.py 
الوجهة الكامنة.‎ de للحصول‎ out file doles لتحديد‎ save latent.py قم بتحرير الملف‎ 


تنفيذ التقدم في شيخوخة الوجه 
في المجلد oiz‏ قم نتتفيل: 


$git clone https://github.com/trlpzz/InterFaceGAN.git$cd 
InterFaceGAN/S$gdown 
https://drive.google.com/uc?id-1MEGjdvVpUsuljBA4zrXZN7Y4kBBOz 
izDQ$mv karras2019stylegan-ffhq-1024x1024.pkl 
InterFaceGAN/models/pretrain/karras2019stylegan-ffhq- 
1024x1024.pkl 


JUSSI 
-Final w vectors إلى‎ input vector.npy قم بتحميل‎ 
الصور.‎ «L5 Y Final w vectors قم بتشغيل هذا الأمر لا » ستخدام‎ 


python test age.py 


لنتائج على النحو التالي: 


التغيراتفي العمر 


إنشاء صور الموضة باستخدام شبكات الخصومة التوليدية 


التغيراتفي الابتسام 


المصدر: 


https://www.neurond.com/blog/gans-face-aging-problems-try-it-with-your-face 


196 12( نقل النمط باستخدام شبكات الخصومة التوليدية 


12( نقل النمط باستخدام شبكات الخصومة التوليدية Style‏ 
Transfer with GANs‏ 


معدمه 


استكشفت عدد من الدراسات الحديثة بعض الطرق والتقنيات لإنشاء صور ille‏ الوضوح )1024 x‏ 
4 بکسل) باستخدام شبكات GAIN‏ (شبكات الخصومة التوليدية Generative Adversarial‏ 
(Networks‏ من المثير للدهشة بشكل لا يصدق رؤية صور عالية الدقة وواقعية للغاية لوجوه بشرية 
وحيوانات وأشياء أخرى تم إنشاؤها بواسطة خوارزمية» خاصة SI‏ صور GAN‏ الأولى منذ بضع 
سنوات فقط. لقد انتقلنا من الصور ذات الجودة المنخفضة والمنقطة إلى الصور القريبة من الواقعفي 
وقت قصير Me‏ وهذا دليل واضح Go‏ على مدى سرعة تقدم الأبحاثفي هذا المجال. 


لكن عند قراءة هذه الدراسات الحديثة (والأكثر صلة بالموضوع هو بحث StyleGAN‏ الذي أعدته 
BigGAN tws Nvidia‏ الذي أعدته (Google‏ أجد Gh‏ الجانب الذي Gers‏ تقليل إحساسي 
بالمفاجأة والإثارة: قوة الحوسبة .computing power‏ إن اكتشاف القدرات الحاسوبية الضخمة 
المستخدمة لالتقاط تلك الصور يجعلني أدرك أن بيني وبين تلك النتائج عقبة لا يمكن التغلب عليها. 
هذه الفكرة وحدها تجعلني أشعر أن التكنولوجيا الجديدة برمتها التي تم استكشافهاني الدراسات تبدو 
لي بعيدة جداء وبالتالي أقل إثارة للدهشة. 


ولهذا السبب» Gogh‏ هذه المقالة استكشاف كيفية جعل شبكات GAN‏ والصور عالية الدقة تعمل G‏ 
دون الحاجة إلى أجهزة باهظة الثمن. مما يفتح فرصا جديدة للأشخاص الذين ليس لديهم بالضرورة 
إمكانية الوصول إلى وحدات معالجة الرسوميات GPU‏ عالية المستوى. يمكن تحقيق كل ما تم شرحه 
هنا باستخدام منصة Google Colaboratory‏ المتاحة Glee‏ والتي توفر وحدة معالجة رسوميات 
GPU‏ مجانية لجميع مشاريع التعلم الآلي/العميق الخاصة بك. 
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هدفنا 

سنحاول إجراء نقل النمط Style Transfer‏ بين مجالين من الصور عالية الوضوح» باستخدام معمارية 
GAN‏ خاصة ولكن بسيطة لأداء مهمتنا. وبشكل أكثر تحديداء سنقوم بتطبيق نمط رسم painting‏ 
style‏ فان جوخ Van Gogh‏ على صور عالية الدقة للمناظر الطبيعية. من العدل أن نقول إن نقل النمط 
كان موضوعا GE pee‏ الرؤية الحاسوبية Computer Vision‏ خلال السنوات القليلة الماضية؛ الورقة 
الأصلية التي بدأت هذا الاتجاه هي "الخوارزمية العصبية للأسلوب الفني" (جاتيس وآخرون) ۸ 
«Neural Algorithm of Artistic Style" (Gatys et al.)‏ والتي استخدمت خطأ المحتوى 
والنمط Content and Style loss‏ على شبكة تلافيفية مدربة مسبقًا pretrained convolutional‏ 
network‏ لأداء المهمة. على الرغم من أن هذه الطريقة يمكن أن تعمل على الصور عالية الدقةء إلا 
أنها يمكنها فقط استخدام صورة واحدة Ue»)‏ نقول ("Starry Night"‏ كتمثيل لأسلوب الرسام. وهو 
فالس عا تند 


أمثلة على نقل النمط من الورقة الأصلية 


من ناحية أخرى. تحتاج GAN‏ بشكل عام إلى مجال من الصور للتدريب عليه وبالتالي فهي قادرةفي 
حالتنا على التقاط أسلوب الرسام بالكامل (يظهر بحث CycleGAN‏ نتائج مثيرة للاهتمام حول نقل 
النمط). 


Input ١ Monet 


أمثلة على نقل نمط CycleGAN‏ 
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ومع ذلك OD‏ تدريب شبكات GAN‏ يعد WIS‏ للغاية من الناحية الحسابية: حيث لا يمكن إنشاء 
صور عالية الدقة إلا باستخدام أجهزة متطورة للغاية وأوقات تدريب طويلة. آمل أن تكون الحيل 
والتقنيات الموضحةفي هذه المقالة قادرة على مساعدتكفي مغامرات توليد الصور عالية الدقة. 


صور عالية الدقة مترجمة إلى نمط فان جوخ 
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المعمارية 

ما سنحاول تحقيقه يسمى ترجمة صورة إلى صورة image-to-1mage translation‏ (من المجال 
A‏ إلى المجال (B‏ هناك طرق مختلفة ومعماريات شبكية لتحقيق ذلك: قد يكون أشهرها 
CycleGAN‏ ولكن يوجد أيضًا عدد من الأوراق البحثية الأخرى حول نفس الموضوع. 

في تجاربي» استخدمت معمارية مخصصة تتكون من شبكة سيامية Siamese Network‏ كمميز 
Discriminator‏ ودالة خطأ loss function‏ خاصة (ولكنها سهلة للغاية). لقد اخترت هذه الطريقة 
لأنها لا تعتمد على الاختلافات لكل بكسلفي أي من الاخطاء: وهذا يعني ببساطة أن الشبكة لا تتبع أي 
قيود هندسية على الصورة التي تم إنشاؤها وبالتالي فهي قادرة على إنشاء ترجمات أكثر إقناعا للصور 
يمكن العثور على شرح عميق وشامل لهذا النوع من المعمارية وكيفية عملهني هذه المقالة الأخرى التي 


فيما يلي مقدمة مختصرة عن معمارية GAN‏ السيامية -(Siamese GAN)‏ 


55 S(A) 
| ^ 
S(G(A)) 


معمارية GAN‏ السيامية 


وهي مصنوعة من مولد واحد (G)‏ ومميز (D)‏ يأخذ © الصورة كمدخل ويخرج الصورة المترجمة 
‘translated image‏ يأخذ D‏ صورة كمدخل ويخرج متجهاً latent vector lu‏ 

لدى المميز السيامي Siamese Discriminator‏ هدفين: إخبار © بكيفية إنشاء صور أكثر واقعية 
والحفاظ على الارتباطفي تلك الصور المزيفة (نفس "المحتوى (content‏ مع الصور الأصلية. 
باستدعاء الصور العشوائية Al‏ و۸2 و21 و22 من المجالات By A‏ على التوالی و× صورة عشوائية. 
de‏ 
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1. يجب أن تكون D(B1)‏ قريبة (المسافة الإقليدية (Euclidean distance‏ من نقطة ثابتة 
(نقطة الأصل على سبيل QUI‏ حين يجب أن تكون D(G(A1))‏ بعيدة عن نفس 
النقطة. وبالتالي فإن المتجهات الأقرب إلى النقاط الثابتة تمثل صورًا أكثر واقعية. من ناحية 
أخرى» يحاول المولد تقليل المسافة من D(G(A1))‏ إلى النقطة الثابتةء بطريقة عدائية 


2 ((10)82-(12)51) يجب أن يكون Glia‏ (تشابه جيب التمام (cosine similarity‏ مع 
(D(G(A1)) -D(GCA2))‏ للحفاظ على "المحتوى" بین A‏ و(6)8 ). يشارك كل من 


المولد والمميزني هذا الهدف. 
vector‏ 
2 
image — |‏ 
2 
JA a‏ 
Loss‏ 
PS‏ 
image —‏ 
| : 
vector‏ 
1 


المميز السيامي 


مع وجود هذين القيدين (الاخطاء)ء الأول يعتمد على حجم المتجهات بينما يعتمد الثاني على الزاوية 
بين المتجهات» يتم تحقيق هدفنا الكامل ويمكننا تحقيق هدفنا النهائي المتمثلفي ترجمة الصورة إلى 
الصورة من المجال ‏ إلى المجال 8. أقترح عليك Go‏ قراءة هذا المقال حيث أقدم شرحًا أكثر شمولاً 
lines‏ لهذه المعمارية» مع عرض الرسوم التوضيحية والأمثلة. 


الآن بعد أن أصبح لدينا المعمارية مقفلةء فلنستكشف كيف وماذا يجب تغذية الشبكة من أجل الوصول 
إلى إنشاء صور عالية الدقة. 


استخراج الصور 

نحتاج إلى مجموعتي بيانات من الصور عالية الوضوح:في حالتنا سنستخدم مجموعة بيانات من المناظر 
الطبيعية (المجال (A‏ ومجموعة بيانات من لوحات فان جوخ (المجال -B‏ ضعفي اعتبارك أنه كلما 
كانت الصور التي تختار العمل بها أكبرء كلما استغرقت المعالجة المسبقة (قصها وتغيير حجمها) تلك 
الصور وقتا أطول (على الرغم من أن ذلك لن يزيد من الوقت الذي تقضيه BE ao‏ تدريب الشبكة!). 


نحن الآن بحاجة إلى اختيار حجم الصور التي سيتم تغذيتها إلى المولد: من الواضح أننا لا نستطيع 
استخدام حجم الصور عالية الدقة بأكملها من مجموعات البيانات. وإلا OB‏ أوقات التدريب وأحجام 


شبكات الخصومة التويدية 


الشبكة ستكون ضخمة ولن يتم حل أي مشكلة. وبالتالي؛ نختار حجمًا صغيرًا بدرجة كافية SxS‏ )64 


x‏ 64 بكسل على سبيل المثال) بحيث يمكن التحكمني أوقات التدريب ويظل كل شيء ممكنًا من 
الناحية الحسابية حتى بالنسبة لوحدات معالجة الرسوميات المتوسطة (مثل تلك المتاحة مجانًا على 


.(Google Colaboratory 


وبالتالي» كماكنت تعتقد. فإن o eal‏ قبل أن يتم تغذيتها إلى المولد. يجب أن يتم قصها (أو اقتصاصها) 
إلى صور SxS‏ أصغر. وهكذاء بعد قراءة الصورة وتحويلها إلى Sy‏ نقوم بإجراء قص SxS‏ عشوائي 
على pall‏ )2 وإضافتها إلى دفعة وتغذية الدفعة إلى الشبكة. يبدو الأمر سهلاً للغاية وهو كذلك بالفعل! 
الآنء لنفترض GT‏ قمنا بتدريب GAN‏ باستخدام هذه الطريقة حتى تتم ترجمة كل محصول SxS‏ 
صغير إلى أسلوب Van Gogh‏ بواسطة المولد بطريقة تُرضينا: كيف يمكننا OY‏ ترجمة صورة عالية 
الدقة بالكامل من المجال A‏ إلى المجال SB‏ 


مرة أخرى, الأمر بسيط للغاية: يتم تقسيم الصورة إلى أجزاء SxS‏ صغيرة (إذا كان حجم الصورة عالية 
الدقة هو .BxB‏ فسيكون لدينا (B//S)x(B//S)‏ صور SxS‏ صغيرة)» تتم ترجمة كل صورة SxS‏ 
بواسطة المولد. وأخيرًا تم ضم كل شيء Ga‏ مرة أخرى. 

ومع «à‏ إذا حاولنا تدريب GAN‏ باستخدام هذه الفكرة البسيطة المتمثلةفي استخراج الصور الأصغر 
من الصور الأكبر حجماء أثناء وقت GLE‏ فسنلاحظ قرييًا مشكلة مزعجة GLS‏ الصور الصغيرة 
المستخرجة بواسطة الصورة الكبيرة التي نريد ترجمتهاء عند تحويلها بواسطة المولد إلى المجال YB‏ 
تمتزج عضويًا do not blend organically together Ú‏ تظهر حواف كل صورة 5×5 بوضوح 
في التركيبة النهائيةء مما يفسد "سحر" عملية نقل النمط الناجحة. هذه مشكلة صغيرة نسبيًا ويمكن أن 
تكون مزعجة للغاية: حتى باستخدام الأساليب المعتمدة على البكسل مثل .CycleGAN‏ لا تزال نفس 
العقبة تظهر. 


الحواف مرئية 
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كيف د يمكننا حل هذه ا لمشكلة؟ 


الحل الذي استخدمته سهل الفهم وأنيق ub QU‏ وهو يمثل الفكرة الأساسية التي أتمنى أن تتذكرها 
(وربما تستخدمها) من هذه المقالة. 

Al‏ نحتاج إلى إعادة النظرني خط سير البيانات الخاص بنا: بينما قبل أن نقطع اقتصاصات SxS‏ مباشرة 
من صورة HD‏ 8×8. يتعين Ule‏ الآن الحصول على اقتصاصات 25:25 (إذا كانت 64 = «S‏ فإننا 
نحتاج إلى اقتصاصات 128×128). بعد ذلك» بعد تعريف المولد الخاص بناء نقوم بإنشاء نموذج 
جديد» يسمى (Combo‏ يقوم بالعمليات التالية: 


خذ مجموعة من الصور 28×28 (من المجال (A‏ كمدخل INP)‏ 
قص كل INP i o‏ إلى 4 صور SxS‏ )INPCUT)؛‏ 
قم بتغذية كل by‏ من صور INPCUT‏ الأربع SxS‏ إلى المولد واحصل على 
OUTCUT‏ (نفس الشكل الدقيق INPCUT J‏ ولكن مع نسخة مترجمة من كل صورة 
‘(SxS‏ 

4. انضم إلى كل مجموعة مكونة من 4 صور OUT CUT SxS‏ واخرج (نفس الشكل الدقيق 
ل INP‏ ولكن مع نسخة مترجمة من كل صورة «QSx2S‏ 


5. الإخراج. 


translation 


يتم بعد ذلك تمرير مخرجات Combo‏ كمدخل إلى المميزء الذي يقبل OT‏ مدخلات ذات حجم 
مضاعف عما كان عليه سابقًا (2525). لا يتطلب هذا التعديل الصغير وقنًا أطول بكثير للحساب 
ويمكنه حل مشكلتنا السابقة بشكل فعال. كيف؟ 


N 
O 
CS 


يضطر المولد الآن إلى إنشاء صور متماسكة فيما يتعلق بالحواف والألوان OV‏ المميز لن يصنف الصور 
المرتبطة غير المتماسكة على أنها واقعية وبالتالي سيخطر المولد بالمكان الذي يمكنه تحسينه. بالغوص 
بشكل أعمق SUB‏ يضطر المولد إلى تعلم LAS‏ إنشاء حواف واقعية على كل من الحواف الأربعة لصورة 
5 د الصورة النهائية 2×2المرتبطةء تكو نكل حافة من الحواف الأربعة على اتصال مع حافة أخرى. 
وحتى حافة واحدة تم إنشاؤها بشكل سيئ من شأنها أن تدمر واقعية الصور 2x2.‏ 


العينات أثناء التدريب: (من اليسار إلى اليمين) صور من المجال A‏ صور مترجمة (AB)‏ صور من المجال B‏ 
كل الأشياء معا 
للتأكد من أن كل شيء حتى هنا واضح ومفهوم دعونا نلخص LAS‏ عمل الشبكة بأكملها. 


الهدف هو تطبيق نمط B‏ على الصور الموجودةفي A‏ يتم قطع الصور ذات الحجم 5 من صور 
عالية الدقةفي كلا النطاقين By A‏ الصور من A‏ هي مدخلات ‘Combo‏ يقوم هذا النموذج بتقطيع 
هذه الصور المزيفة AB‏ 


الآن دعونا نركز على المميز السيامي D‏ حجم مدخلاته هو ضعف حجم مدخلات المولد «(QSx2S)‏ 
في حين أن الإخراج هو متجه بحجم -LENVEC‏ 


يقوم D‏ بترميز الصور إلى متجهات DX)‏ مثل: 
1. يجب أن يكون DB)‏ قريبًا من الأصل (متجه الأصفار بحجم VECLEN‏ ): 
1 هو مربع المسافة الإقليدية ل DB)‏ من نقطة الأصلء لذا :EuckDCA))?‏ 
2. يجب أن es D(AB) oso‏ عن نقطة الأصل: 


(max(0, cost — Eucl(D(AB))))? هي‎ LossD2 
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3. يجب أن oS‏ متجهات التحويل (D(A1)-D(A2)) and (D(AB1)-D(AB2))‏ 
متجهات متشابهة. للحفاظ على "محتوى" الصور: 


3 هو cosine similarity(D(A1)-D(A2), D(AB1)-D(AB2))‏ 
من ناحية أخرى. يجب على المولد إنشاء صور (منضمة AB (joined‏ مثل: 

5. يجب أن يكون D(AB)‏ 3 من نقطة الأصل: 
1 هو Eucl(D(AB))?‏ 


6. يجب أن تكون متجهات التحويل (D(A1)-D(A2)) and (D(AB1)-D(AB2))‏ 
متجهات متشابهة (نفس هدف المميز): 
2 هو cosine similarity(D(A1)-D(A2), D(AB1)-D(AB2))‏ 


يمكن العثور على شرح Goel‏ حول كيفية عمل كل واحدة من هذه الاخطاءفي مقالتي هناء حيث أشرح 
بالتفصيل كيفية عمل المميز السيامى (أعتقد أنها تستحق القراءة!). 


[Sia‏ توما 


Apt pe يكن‎ dc عزون وک‎ aa adl ela ctio fec 
iLaxa SxS إلى ضور‎ acl بعد‎ GUI عند فج مون كاملةعالية‎ c, idus cil ol تناقض فق‎ 
يصون‎ tous Do dall Els حورا‎ io Loa loti udi إلى‎ tes ا‎ af 

dn 


أمثلة الترجمة على الصور عالية الدقة: على الرغم من أنها ليست مثالية إلا أنه يتم إنشاء ضربات فرشاة واقعية وتبدو الصور متماسكة تمامًا. 
قد تكون الحلول هي ضبط الشبكات وسعة أكبر 

الاستنتاج 

لا تزال التقنية الموضحةفي هذه المقالة تعرض بعض المشكلات التى نحتاج إلى معالجتها. 

إذا تم اختيار صور عالية الوضوح للغايةء فإن الاشياء الصغيرة المستخدمة لتدريب الشبكة قد لا تحتوي 

على أي معلومات ذات صلة (قد تكون مجرد ألوان صلبةء تشبه وحدات البكسل المفردة) وبالتالى قد 

لا يكون التدريب ناجحًا: يحتاج كل من المولد والمميز نوع ما من المعلومات المراد معالجتها (يجب 


على المميز تشفير الصور Eby‏ على "محتواها') وقد يواجه بعض المشكلات إذا لم تكن هذه المعلومات 
متاحة. 


4 


بعض المناطق 
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حتى لو انتهى التدريب بنجاح» عند ضم جميع الاقتصاصات المختلفة لصورة ذات دقة عالية De‏ فإن 
المساهمة الأسلوبية لكل صورة صغيرة مترجمة ليست كافية لكامل الصورة عالية الدقةء والتي Ue‏ ما 
تبدو مشابهة للصورة الأصلية مع تغيير فقطفي ألوانها. 

في تجاربي» وجدت أنه بالنسبة لمرحلة التدريب» OB‏ استخدام نسخة تم تغيير حجمها (دقة أقل) من 
مجموعة البيانات عالية الدقةء أثناء التبديل إلى الصور عالية الدقة بأكملها عند الترجمةء يساعد بالتأكيد 
فيما يتعلق بالمشكلة الأولى. 


تترك هذه التقنية الكثير مما يجب استكشافه: يمكن أن يكون من الممكن إجراء أنواع أخرى من ترجمات 
الصور تختلف عن نقل النمط التقليدي. من المهم أن تتذكر أن المولدفي الحالة المعروضة ليس لديه أي 
فكرة عن سياق الصورة عالية الدقة بأكملها و"يرى" فقط الاشياء ذات الدقة المنخفضة. وبالتالى» فإن 
elkel‏ المولد بعض السياق Gly)‏ شكل "متجه سياق "context vector‏ مشفر؟) حول الصور 
بأكملها يمكن بالتأكيد أن يوسع نطاق تطبيقات هذه التقنية» مما يفتح إمكانيات لأنواع أكثر تعقيدا 
"مدركة للسياق "context aware‏ من ترجمات الصور Bul Whe‏ (الأشياء إلى الأشياء الأخرى 
والوجوه والحيوانات). 

AU‏ كما كنت قد فهمت. OU‏ الاحتمالات لا حصر لها ولم يتم اكتشافها بعد! 

المصدر: 


ans-on-hd-images- 


https://towardsdatascience.com/style-transfer-with 


88e8efcf3716 
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Image Translation using GANs 
هي‎ «Generative Adversarial Network(CycleGAN) شبكة الخصومة التوليدية للدورة‎ 
لمهام ترجمة الصورة‎ deep convolutional networks طريقة لتدريب الشبكات التلافيفية العميقة‎ 
ى لمهام ترجمة‎ AJ GAN على عكس نماذج‎ -Image-to-Image translation إلى الصورة‎ 
بين مجال صورة واخر باستخدام نهج غير خاضع‎ mapping التعيين‎ CycleGAN الصور. تتعلم‎ 
لا‎ Ul إذا كنا مهتمين بترجمة صورة حصان إلى صورة حمار وحشي؛‎ Ui للأشراف. على سبيل‎ 

Jj ال‎ Vi dl phony sla إلى‎ ld الان‎ tad Gy ull col de pam حرا‎ call 
على تعلم‎ Generator Networks بذلك هي من خلال تدريب شبكة المميز‎ CycleGAN بها‎ 
domain ) Y من المجال‎ ele إلى صورة تبدو وكأنها‎ (domain X) X التعيين من المجال‎ 
صحيح).‎ Sal (CY 

سوف تحصل على فهم أعمق لكيفية القيام بذلك أثناء سيركفي هذه المقالة. لذلك دعونا نبداً... 


CycleGAN 


L2 Loss 


Real Image in domain A Fake _ in domain B N Reconstructed Image 


Gea generates a reconstructed image of domain A. 
This makes the shape to be maintained 
real or fake ? when Gas generates a horse image from the zebra. 


Discriminator Z domain B 


Real Image in domain B 
CycleGAN معمارية‎ 


بالنسبة لمجموعة الصور المقترنة paired images‏ . يمكننا إنشاء GAN‏ مباشرة لتعلم التعيين من X‏ 
إلى y‏ بمساعدة .Pix2Pix‏ يمكنك قراءة المزيد عن شبكات Pix2Pix‏ هنا. 
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لكن إعداد مجمرعات Xia‏ مق Carey Suo Gy Garey ULM‏ على سيل isi‏ .ما أعثيه 
بالمجموعة المقترنة هو أننا بحاجة إلى صورة حمار وحشي في نفس وضع الحصان أو بنفس الخلفية 
حتى نتمكن من تعلم التعيين. 

لتكون قادرة على حل هذه المشكلة» تم تطوير معمارية .CycleGAN‏ تمكن CycleGANs‏ من تعلم 
التعيين من مجال × إلى مجال Y ST‏ دون الحاجة إلى العثور على أزواج تدريب متطابقة Males‏ دعونا 
نلقي نظرة على كيفية قيام CycleGAN‏ بذلك. 


لنفترض أن لدينا مجموعة من الصور من المجال X‏ ومجموعة غير مقترنة unpaired images‏ من 
الصور من المجال Y‏ نريد أن نكون قادرين على ترجمة صورة من مجموعة إلى أخرى. للقيام بذلك 
نحدد تعيين G(G: X-SY)‏ الذي يبذل قصارى جهده لتعيين X‏ إلى لا. ولكن مع البيانات غير 
المقترنةء لم تعد لدينا القدرة على النظر إلى أزواج البيانات الحقيقية والمزيفة. لكننا نعلم أنه يمكننا 
تغيير نموذجنا لإنتاج مخرجات تنتمي إلى المجال المستهدف. 


generated image, G(x) 


y at 


zl 


UN هكد‎ 


input image, £ generated image, G(x) 


لذلك عندما تقوم بدفع صورة حصان (المجال (OX‏ يمكننا تدريب المولد لإنتاج صور واقعية المظهر 
للحمير الوحشية (المجال (CY.‏ لكن المشكلةفي ذلك هي أننا لا نستطيع إجبار مخرجات المولد على 
التوافق مع مدخلاته (في الصورة أعلاه. التحويل الأول هو الترجمة الصحيحة من صورة إلى صورة). 
يؤدي هذا إلى مشكلة تسمى انهيار الوضع mode collapse‏ حيث قد يقوم النموذج بتعيين مدخلات 
متعددة من المجال × إلى نفس الإخراج من المجال GY‏ مثل هذه الحالات» بالنظر إلى حصان 
الإدخال (المجال OX‏ كل ما نعرفه هو أن الإخراج يجب أن يبدو كما يلي: حمار وحشي (المجال (Y‏ 
ولكن للحصول على التعيين الصحيح للمدخلاتني المجال المستهدف المقابل: نقدم تعييتا إضافيًا 
مثل التعيين العكسي Y->X) inverse mapping‏ :6)6 الذي يحاول تعيين لا إلى X‏ وهذا ما 
يسمى قيد اتساق الدورة .cycle-consistency constraint‏ 
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فكرني الأمر على هذا النحوء إذا قمنا بترجمة صورة حصان (المجال CC‏ إلى صورة حمار وحشي 
(المجال (Y‏ ثم قمنا بالترجمة مرة أخرى من حمار وحشي (المجال (Y‏ إلى حصان (المجال (X‏ 
فإننا يجب أن نعود إلى نفس صورة الحصان التي بدأنا بها. 

يجب أن تعيدك دورة الترجمة الكاملة إلى نفس الصورة التي بدت بها.في حالة ترجمة الصورة من 
المجال × إلى المجال لا إذا تحقق الشرط التالي نقول إن تحويل الصورة من المجال × إلى المجال 
Y‏ كان صحيحا. 


G yix (Gxioy(r)) ST 
1- الحالة‎ 
من أن النموذج يتعلم التعيين الصحيح من المجال‎ CycleGAN بمساعدة قيد اتساق الدورةء تتأكد‎ 
Y إلى المجال‎ X 
مهمة الترجمة من صورة إلى صورة‎ 
يتم تقسيم المهمة التالية إلى سلسلة من المهام الصغيرة بدءًا من تحميل البيانات وتصورها وحتى نماذج‎ 


التدريب. 


تصور مجموعة البيانات 
ley‏ وجه التحديد. سنلقي نظرة على مجموعة من الصور لمنتزه يوسمايت الوطني Yosemite‏ 
National Park‏ التي تم التقاطها إما خلال الصيف أو الشتاء. الفصول هي المجالين لدينا! 


صور من مجال فصل الشتاء. 
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بشكل عام» يمكنك أن ترى أن الصور الصيفية أكثر إشراقا وأكثر خضرة من الصور الشتوية. يحتوي 
الشتاء على أشياء مثل الثلج والصور الغائمة.في مجموعة البيانات هذه. سيكون هدفنا الرئيسي هو تدريب 
المولد الذي يتعلم تحويل الصورة من الصيف إلى الشتاء والعكس. لا تحتوي هذه الصور على تسميات 
ويشار إليها ببيانات التدريب غير المقترنة -unpaired training data‏ ولكن باستخدام CycleGAN‏ 
يمكننا تعلم التعيين من مجال صورة إلى ST‏ باستخدام النهج غير الخاضع للأشراف. 

يمكنك تحميل البيانات التالية بالضغط هنا. 


تعريف النماذج 
يتكون CycleGAN‏ من مميزين (D. ys D. x)‏ ومولدين G. xtoy)‏ وتامالا_6). 
DD × o‏ يحدد صور التدريب من المجال X‏ على أنها حقيقية والصور المترجمة من المجال 
لا إلى المجال X‏ على أنها مزيفة. 
Dy ٠‏ يحدد صور التدريب من المجال X‏ على أنها حقيقية والصور المترجمة من المجال 
لا إلى المجال X‏ على أنها مزيفة. 
:G xtoy e‏ يترجم الصور من المجال X‏ إلى المجال Y‏ 
:G ytox °‏ يترجم الصور من المجال Y‏ إلى المجال X‏ 
المميز 
إن المميزات «CycleGAN &D ys D x‏ عبارة عن شبكات imas‏ تلافيفية convolutional‏ 
neural networks‏ " الصورة وتحاول تصنيفها على أنها حقيقية أو مزيفة.في هذه الحالة» يشار إلى 
الحقيقي بمخرج قريب من 1 ومزيف بالقرب من 0. تتمتع المميزات بالمعمارية التالية: 
f helper conv function‏ 
cder conv (IR CREASE, Out Channels, kernel size; SEAS,‏ 
padding-1, batch norm-True):‏ 


"""Creates a convolutional layer, with optional batch 
normalization. 


nw 


layers = [] 

conv layer - nn.Conv2d(in channels-in channels, 

out channels-out channels, 

kernel sizskernell size, Stride=srride;, paclinc=paciii ae; 
bias=False) 


layers.append(conv layer) 


if batch norm: 
layers.append(nn.BatchNorm2d(out channels)) 
return nn.Sequential(*layers) 
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class Discriminator (nn.Module): 


cer imite (SSL, cony chim=64) 8 
Super (Dise riminator Ses EIC NR) 


# Define all convolutional layers 
# Should accept an RGB image as input and output a single 


value 

geli layer 1 = cony (S Cony Chin, ىك‎ barce nomm = False) 
selt layer 2 = conv (conv Chim, CONV dim*2Z,4) 

sellrt- lays 3 = Cony (Cony cim: 2; Cony Cie p 4) 
self.layer 4 = conv(conv dim*4,conv dim*8,4) 

seli- laysr 5 = comy(comy Cime, 1,4, 1, barchi norm = relse) 


def forward (self, x): 
# define feedforward behavior 


x = Porelulgelt layer il (x) )) 
x ك‎ Porelulgelr laysr 2) 
x e P relu (OSL E layer 3 ) 
x = desees Gel  layst 4 2)) 
x = gelr layer 5 (x) 


return x 
الشرح:‎ 
تنتج لوجيت‎ convolutional layers تتكون المعمارية التالية من خمس طبقات تلافيفية‎ e 
متصلة‎ Abb يحدد هذا اللوغاريتم ما إذا كانت الصورة حقيقية أم لا. لا توجد‎ ely logit 
هذه المعمارية.‎ (3fully connected layer بالكامل‎ 
batch جميع الطبقات التلافيفيةء باستثناء الطبقة الأولى والأخيرة يتبعها تسوية بالدفعات‎ e 
.(conv helper function مساعد التحويل‎ Ils (محددةفي‎ normalization 
-ReLU تفعيل‎ 3l» يتم استخدام‎ hidden units بالنسبة للوحدات المخفية‎ e 
)conv dim بعد كل التفاف على المعلمة‎ feature maps الميزات‎ Lil > يعتمد عدد‎ e 
1 (conv dim - 64 تطبيقي‎ 
بنفس المعماريةء لذلك نحتاج فقط إلى تحديد فئة واحدة ثم‎ D yD x كل من‎ gem o 
المتبقية‎ Vlg المتبقية‎ HI 
والدالة المتبقية‎ (Resnet Block) Resnet سنستخدم شين يسمى كتلة‎ A) gall أثناء تعريف معمارية‎ 
والدالة المتبقية هي كما يلي:‎ Resnet معماريتنا. الفكرة وراء استخدام كتلة‎ (residual function) 
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تقوم الكتلة المتبقية بتوصيل المشفر encoder‏ ومفكك الشفرة decoder‏ الدافع وراء هذه المعمارية 
هو كما يلي: قد يكون من الصعب جد تدريب الشبكات العصبية العميقة. حيث من المرجح أن يكون 
لديها تدرجات gradients‏ متفجرة exploding‏ أو متلاشية «vanishing‏ وبالتالي» تواجه Qe neo‏ 
الوصول إلى التقارب ‘convergence‏ التسوية بالدفعات تساعدفي هذا قليلاً. 


أحد الحلول لهذه المشكلة هو استخدام كتل Resnet‏ التي تسمح لنا بتعلم ما يسمى بالدوال المتبقية 
عند تطبيقها على مدخلات الطبقة. 

الدالة المتبقية 

عندما نقوم بإنشاء نموذج التعلم العميق» يكون النموذج ide)‏ طبقات مع عمليات التنشيط المطبقة) 
مسؤولاً عن تعلم التعيين» IM‏ من المدخلات x‏ إلى المخرجات y‏ 


M(x) =y 
يمكننا بدلاً من ذلك تحديد دالة متبقية.‎ cy إلى‎ X بدلاً من تعلم التعيين المباشر من‎ 
F(x) = MG)O-x 


ينظر هذا إلى الفرق بين التعيين المطبق على x‏ والإدخال الأصلي dole x‏ ما تكون Ube F(x)‏ عن 
طبقتين تلافيفيتين + طبقة تسوية ReLU‏ بينهما. يجب أن تحتوي هذه الطبقات التلافيفية على نفس 
عدد المدخلات مثل المخرجات. ويمكن بعد ذلك كتابة هذا التعيين على النحو التالي؛ دالة للدالة 
المتبقية والمدخلات X‏ 


M(x) = F(x) +x 


يمكنك قراءة المزيد عن التعلم المتبقي العميق هنا. فيما يلي مقتطف التعليمات البرمجية لتطبيق الكتل 
المتبقية. 


class ResidualBlock(nn.Module): 

"""Defines a residual block. 

This adds an input x to a convolutional layer (applied to x) 
with the same size input and output. 

These blocks allow a model to learn an effective 
transformation from one domain to another. 


nm 


Cleric (elr, cony okim) 5 
super(ResidualBlock, self). init  () 
* conv dim = number of inputs 


# define two convolutional layers + batch normalization that 
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Halll ace aS Othe mesicwiall 2ك اع‎ 11 i (sx) 
# layers should have the same shape input as output; I 
suggest a kernel elize (Qu 3 


seli deyar dL = cony (Com Chim cony Chin, $5 Ly Lr loretereley norm = 
True) 
seli- layer 2 = Cony (Cony Chim conwy thin, 3; 1, Lo barca norm = 
True) 


def forward(self, x): 

# apply a ReLu activation the outputs of the first layer 
f return a summed output, x + resnet block (x) 

oue db = FFE (SOLT. lamer 3L (ou) ) 

Gut 2 = x + seli- layar Zone 1) 


EE EDED out 2 

المولد 
يتكون G ytoxs Generator G xtoy‏ من المشفر conv net; «encoder‏ تحول الصورة إلى 
تمثيل صغير للميزات» ومفكك شفرة «decoder‏ وشبكة transpose conv‏ مسؤولة عن تحويل 
تمثيل الميزة إلى صورة محولة .transformed image‏ فيما يلي مقتطف التعليمات البرمجية لتنفيذ 

المولد. 
مك6 861 der clecomy (in Channels, Olle chemmels, kernel sire,‏ 
padding-1, batch norm-True):‏ 


mu ercaucsa El s amsposcseonmveibke mad AMEE, wirta CO TOT Ce CO T HS 
batch normalization. 


nmm 


layers = [] 

# append transpose conv layer 
layers.append(nn.ConvTranspose2d(in channels, out channels, 
kernel sizə, siecle, jorclehime, OLES= )) 

f optional batch norm layer 

if batch norm: 

layers.append(nn.BatchNorm2d(out channels)) 

return nn.Sequential(*layers) 


class CycleGenerator (nn.Module): 


det _ imit (seli, cony CMO, m res lollochs=6)) B 
super (Cycilecemeceicor, feli) s imit () 


# 1. Define th ncoder part of the generator 


selt layer dL = cony (Sip Conwy Clainn, 4) 
selt layer 2 = conv (conv Chim, conv dim*2, 4) 
seli dayar € = COnN (Cony CIM p COM Shia, A 


# 2. Define the resnet part of the generator 
layers = [] 
ror n in 125:86 هذا‎ res blocks) 8 
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layers.append(ResidualBlock(conv dim*4)) 
selt res blocks = nn. Sectential (layare) 

# 3. Define the decoder part of the generator 

selt layer 4 = Clocomy (Cony Chime 4, ronan, dm 274) 
self.layer 5 = deconv(conv_dim*2,conv_dim, 4) 

seli- layer 6 clexcomny (omy Chim, Sip, bacchi norm = Pelee) 


def forward(self, x): 

"""Given an image x, returns a transformed image.""" 

# define feedforward behavior, applying activations as 
necessary 


out = 15 SLU (Selle 1 218157515 Lizi) 
Quis = Fo لاقم‎ ) lees 2 (eue) ) 
كلاه‎ = sew sels layer SOME) ) 
Obie = selir res lolo (mn) 

Que = IPs (sess layer 4! (exe) ) 
Ott = Powel (sills. laysr SOME) ) 
Gut = للد ) لتم ظ‎ layer 6 (ole) ) 
Ee EUT (ls 


الشرح: 

e‏ تتكون المعمارية التالية من ثلاث طبقات تلافيفية للمشفر وثلاث طبقات تلافيفية منقولة 
لمفكك الشفرة» وكلاهما متصلان باستخدام سلسلة من الكتل المتبقية (في حالتنا 6). 

ه جميع الطبقات التلافيفية يتبعها تسوية بالدفعات. 

e‏ جميع الطبقات التلافيفية المنقولةء باستثناء الطبقة الآخيرة» يتبعها تسوية بالدفعات. 

٠‏ بالنسبة للوحدات المخفية: يتم استخدام دالة التنشيط ReLU‏ باستثناء الطبقة الأخيرة حيث 
نستخدم دالة التنشيط tanh‏ 

o‏ يعتمد عدد خرائط الميزات بعد كل التفاففي المشفر ومفكك الشفرة على المعلمة 


.conv dim 


يتمتع كل من ytoxy © xtoy‏ © بنفس المعمارية» لذلك نحتاج فقط إلى تحديد Eà‏ واحدة ثم 
إنشاء مولدين GEN‏ 

عملية التدريب 

تشتمل عملية التدريب على تحديد دوال الخطأ واختيار المحسن وأخيراً تدريب النموذج. 
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laa‏ المميز والمولد 

لقد رأينا أن شبكات GAN‏ العادية تتعامل مع IA‏ كمصنف مع دالة Les‏ الإنتروبيا السيني 
sigmoid cross-entropy loss‏ ومع ذلك» قد تؤدي دالة الخطأ هذه إلى مشكلة التدرج المتلاشي 
vanishing gradient‏ أثناء عملية التعلم. للتغلب على هذه المشكلة» سنستخدم دالة خطأ المربعات 
الصغرى least-squares loss function‏ للمميز. WL‏ ما ols‏ إلى هذه المعمارية باسم شبكات 
GAN‏ ذات المربعات الصغرى Least Square GANS‏ ويمكنك قراءة المزيد عنها من الورقة 
الأصلية لشبكات .LSGAN‏ 


خطأالمميز 

ستكون اخطاء المميز هي متوسط الأخطاء المربعة mean squared errors‏ بين مخرجات المميز في 
ضوء dy peal‏ والقيمة المستهدفةء 0 أو 1ء اعتمادًا على ما إذا كان ينبغي تصنيف تلك الصورة على أنها 
مزيفة أو حقيقية. على سبيل المثالء بالنسبة لصورة حقيقيةء OX‏ يمكننا تدريب D. x‏ من خلال النظر 
في مدى قربها من التعرف على الصورة × باعتبارها حقيقية باستخدام متوسط الخطأ المربع: 


out=D x(x) 


real error = torch.mean((out-1)?) (for Pytorch) 


خطأالمولد 

في clia‏ سنقوم بإنشاء صور مزيفة تبدو وكأنها تنتمي إلى المجال X‏ ولكنها تعتمد على صور من المجال 
Y‏ والعكس صحيح. سنقوم بحساب الخطأ الحقيقي لتلك الصور التي تم إنشاؤها من خلال النظر إلى 
مخرجات المميز عند تطبيقها على هذه الصور المزيفة. 

بالإضافة إلى الخطأ العدائي s> deo «adversarial loss‏ خطأ المولد Generator loss‏ خطأ 
اتساق الدورة .cycle consistency loss‏ تعد هذه الخطأ مقياسًا لمدى جودة الصورة المعاد بناؤها 
عند مقارنتها بالصورة الأصلية. على سبيل Soll‏ لدينا صورة مزيفة X^‏ وصورة حقيقية cy‏ يمكننا 
إنشاء y^‏ من x^‏ بمساعدة xtoy(G xtoy(x^) = y^)‏ 6. هنا سيكون la‏ اتساق الدورة هو الفرق 
المظلق a‏ وال اله — 


A Ek ER 


X Y X Yl. 
ycle-consistency A *@\...- F- ا‎ eee 


خطأ اتساق الدورة 
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فيما يلى مقتطف الكود لتحديد الاخطاء. 


def real mse loss(D out): 
# how close is the produced output from being "real"? 
SEVEN corca mean (UD. oue = Il) 2) 


def fake mse loss(D out): 
# how close is the produced output from being "fake"? 
EE EUEN EOE RM. mean (DD Up) 


def cycle consistency loss(real im, reconstructed 1m, 
lambda weight): 

f calculate reconstruction loss 

# return weighted loss 

LOSS = cOwSlnimSeia (Toreh los! (real alin = iwScromeiciebkeicexe skin) ) 
return loss*lambda weight 


في خطأ اتساق الدورة. يكون حد لامدا lambda‏ هو معلمة الوزن التي ستقوم بوزن متوسط الخطأ 
المطلقفي الدفعة. من المستحسن إلقاء نظرة على ورقة CycleGAN‏ الأصلية للحصول على قيمة أولية 
لوزن lambda‏ 


المحسن 

بالنسبة ل «CycleGAN‏ قمنا بتحديد ثلاثة أدوات تحسين للمولدات D x(G ytox; G xtoy)‏ 
y‏ ©. بالنسبة لجميع أدوات تحسين الأداء» فإننا نستخدم Adam‏ يتم اختيار جميع المعلمات الفائقة 
للقيم من ورقة CycleGAN‏ الأصلية. 


f hyperparams for Adam optimizers 
lr- 0.0002 

loieteel— 19.5 

beta2- 0.999 


G perems = ligt (E EON paremsrtcers()] et 
list(G YtoX.parameters()) # Get generator parameters 


# Create optimizers for the generators and discriminators 
g optimizer = optim.Adam(g params, lr, [betal, beta2]) 

Gl x Optimizer = gorim Acem X paremsters(); Tr; Moeral; 
beta2]) 

(ol y Optimizer = Gorim Noten (UD) V- peremercers (y dies Becca, 
beta2]) 


التدريب 
عندما يتدرب «CycleGAIN‏ ويرى مجموعة واحدة من الصور الحقيقية من المجموعتين Yo X‏ 
فإنه يتدرب عن طريق تنفيذ الخطوات التالية: 
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e‏ حساب Discriminator D x bs‏ على الصور الحقيقية. 
e.‏ قم بإنشاء صور مزيفة بمساعدة G ytox‏ با ستخدام صور من المجموعة Y‏ ثم احسب 


الخطأ المزيف ل D‏ 


e‏ حساب الخطأ الإجمالي وإجراء الانتشار الخلفي والتحسين. افعل الشيء نفسه مع y‏ (1 وقم 


بتبديل المجال الخاص بك. 


للمولد: 


0 قم بإنشاء صور مزيفة تشبه المجال f X‏ على صور حقيقيةفي المجال SY‏ قم بحساب 
es‏ المولد tle‏ على كيفية استجابة × D‏ ل × المزيف. 

Li ddl على ضور المزيقةقي‎ ft lagly معاد‎ Y^ قم بإنشاء صو‎ e 

e‏ حساب bs‏ اتساق الدورة على صور Y‏ المعاد بناؤها والحقيقية. 

S e‏ الخطوات من 1 إلى 4 مع تبديل المجالات فقط وإضافة BE‏ اخطاء المولد وإجراء 


ENTE 
إليك مقتطف الكود للقيام بذلك.‎ 


def training loop(dataloader X, dataloader Y, 


test dataloader X, 


n epochs-1000): 


print every-10 


test dataloader Y, 


# keep track of losses over time 


losses = 


[] 


test iter xX = it 
test iter Y = it 


r(test dataloader X) 
r(test dataloader Y) 


# Get some fixed data from domains X and Y for sampling. 


training, that allow us to inspect the 


# make sure to scale to a range -1 


These are images that are held 
f constant throughout 

model's performance. 

Sel M = CES EOE X nexe) IO] 
Tiec Y = test iter eRe () 10] 
TSC 4 = EELS (ELEC 24) 

To di 

Tiec 4 = gCEle(iixecl 6) 


# batches per epoch 


icer X = 


iter(dataloader X) 
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icer Y = irer (dataloacer X) 
barches per COC = min (len (abes Xy lentirsr 2) ) 


ror epoch in rangell, n epocmsri) 8 


# Reset iterators for each epoch 


ii للم مضه‎ v barcthes per epoch == 0; 

irer X = irer (dertcaloacder X) 

icer wf = irer (dercaloacder X) 

magee Xy = IST Xo Nexe) 

images X = scale(images X) # make sure to scale to a range - 
i ite 1 

MACOS Xy _ = Iter X ese) 

images Y = scale(images Y) 


# move images to GPU if available (otherwise stay on CPU) 


863163 = OER 15153 (YEmcesO” ir torch. ctde als. available) 
else "cpu") 

images X = images X.to (device) 

images Y = images Y.to(device) 

it 

# TRAIN THE DISCRIMINATORS 

it 


# First: D X, real and fake loss components ## 


t 1. Compute the discriminator losses on real images 
d x optimizer.zero grad() 

zeal D logs = real mse 1888 (D. X lUmages X) ) 

i So Compute the taks loss tor D X 

rake D lose = rake mee MOSS (DIG (Chico limages X) ) 

t 4. Compute the total loss and perform backprop 

Gl sx loss = meal D loss + rake D losis 

d x loss.backward() 

(Gl x عدت لد ع فرت‎ svS) 


## Second: D Y, real and fake loss components ## 
(Gb y optimizer, zero CEA) 
real D y LOSS = real mes loss (D 3? (imeges X) )) 


fake D y loss = fake mse loss(D Y(G XtoY(images X))) 
Gl y loss = real JD y loss + rake D Sy LOSS 


d y loss.backward() 
Gl _ y OEM gus? s staol) 
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# 
# TRAIN THE GEN 
" 


I 


,RATORS 


ff First: generate fake X images and reconstructed Y images 
Td 
g optimizer.zero grad() 

f 1. Generate fake images that look like domain X based on 
real images in domain Y 

Ove 1 = € VrO ) 1112638 X) 

# 2. Compute the generator loss based on domain X 

loss i = real mse Joss(D (owe 3)) 

# 3. Create a reconstructed y 

ott 2 = © XEON (our 1) 

# 4. Compute the cycle consistency loss (the reconstruction 
loss) 

loss 2 = eyele Consistency Loss (ieee im = MESE Y, 
reconstruct الت‎ UM = owr 2; lenoe vericht=10) 


## Second: generate fake Y images and reconstructed X images 
LE 

One 3 = (& Meow (abscess 9) 

# 5. Add up all generator and reconstructed losses and 
perform backprop 


loss 3 = real mse loss (D X (our 3)) 
owe 4 = © Yro (our 3) 
loss 4 = celis Consistency loselreell im = megas X, 


reconstructed im = out 4, lambda weight-10) 


g totel loss = loss 1 + loss 2 + logs ð + loss 4 
g total loss.backward() 
g optimizer.step() 


# Print the log info 

if epoch I prine CVO == 

# append real and fake discriminator losses and the 
generator loss 

LOSES. closure! (e e LOSS. ireny CC y LOSS TES) y 

Gy coral Loss abun (0) )) 

print ("Epocha [13560/1256] | ex loss: (36.4) | el Y losss 
(soi? | G total Losses (sto. dic}! EOE f 

epoch, nm epochs, CX loss iten), diy Voss ttem] y 

G corel LOSE alicem() N) 


sample every-100 
# Save the generated samples 


E epoch) v sample svery == 
G YtoX.eval() # set generators to eval mode for sample 
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generation 

G XtoY.eval() 

Savessampites(epochyeetüxedqv KSC Ay CG MEST, G EON, 
Baten Size 16) 

CCO wrcrelaliol (()) 

6 EON E Eam) 


uncomment these lines, if you want to save your model 
checkpoint every-1000 

# Save the model parameters 

Lit epoch % Checkpoint eyarzy == (Us 

checkpount(epochm © XEON, © NEO, DEX; D X) 


JE db db db dk 


return losses 


يتم تنفيذ التدريب على مدى 5000 فترة epochs‏ باستخدام وحدة معالجة الرسوميات «GPU‏ ولهذا 
السبب اضطررت إلى نقل النموذج والمدخلات الخاصة بي من وحدة المعالجة المركزية CPU‏ إلى 
ides‏ ال السو مات GPU‏ 

النتاتج 

ecelesie bloss o Led‏ يعد كل ف 


Training Losses 


Discriminator, X 
Discriminator, Y 
Generators 

8 

6 

| | | | | | | ! | 
| | an ۳7 | | | | | n" ١ lj 
dA, Ms JA PL ANN aM ULAR LI 

" l y | | W T nmi i) j | j MI T M [uL 

2 

; Je obs dedi, Wt al M. "eT Mal ايا سنو يا ير‎ TRA. CR یہلا بی اہ اہی ب‎ RTT 

500 400 300 5 200 100 0 
يمكننا أن نلاحظ أن المولدات تبدأ بخطأ كبير جداء ولكن مع مرور الوقت تبدأفي إنتاج ترجمات جيدة 


للصورء مما يساعدفي تقليل الخطأ. 
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يُظهر كلا خطأين المميز تقلبًا Ghis Gab‏ الخطأ. ولكن بحلول نهاية 5000 فترة epoch‏ يمكننا أن 
نرى أن كلا من أخطاء المميز قد انخفضت. مما يجبر المولدات على القيام بترجمات صور أكثر واقعية. 
o‏ تصورالعينات. 


بعد 100 تكرار: 


XtoY 


Ytox 


0 200 400 600 800 1000 


الترجمة من Y‏ إلى X‏ بعد 100 تكرار 


الترجمة من X‏ إلى Y‏ بعد 5000 تكرار 


YtoX 


0 200 400 600 800 1000 


الترجمة من Y‏ إلى X‏ بعد 5000 تكرار 


يمكننا أن نلاحظ أن نماذج CycleGAN‏ تنتج صورًا منخفضة BUI‏ وهذا مجال بحث مستمر 
ويمكنك قراءة المزيد عن الصيغة عالية الدقة التى تستخدم مولدات متعددة بالنقر | 2 


يواجه هذا النموذج صعوبةفي مطابقة الألوان GLS‏ وذلك eX‏ إذا كان G ytox; G xtoy‏ قد يغيران 
لون الصورة؛ قد لا Shy‏ خطأ اتساق الدورة ويمكن أن يظل صغيرًا. يمكنك اختيار تقديم مصطلح خطأ 
جديد يعتمد على اللون يقارن بين «X» G xtoyGO; ys G ytox(y)‏ ولكن يصبح هذا بعد ذلك 
أسلويًا للتعلم تحت الإشراف. ومع ذلك» تمكنت CycleGAN‏ من القيام بترجمات مرضية. 


model-d58cfff04755 


EZA‏ 14( تلوين الصور بالأبيض والأسود باستخدام à& ui‏ الخصومة التوليدية 


14( تلوين الصور بالأبيض والأسود باستخدام شبكة 
الخصومة التوليدية GAN‏ في Colorizing TensorFlow‏ 


B/W Images with GANs in TensorFlow 
واحدة من أكثر المواضيع إثارة للاهتمامني التعلم الآلي اليوم. لقد تم استخدامهافي‎ GAN تعد شبكات‎ 
للغايةني كل حالة. تتكون‎ Oye وكان أداؤها‎ CMINIST عدد من المشكلات (وليس فقط لإنشاء أرقام‎ 
generator من مولد‎ (General Adversarial Network (شبكة الخصومة العامة‎ GAIN شبكة‎ 
رياضيًا‎ Gages يتنافسان ضد بعضهما البعض لتحقيق نتائج مذهلة. سنتبع هنا‎ discriminator x; 
تأتي من‎ GAN أن فكرة تدريب‎ lay الخاصة بها.‎ loss functions ودوال الخطأ‎ GAN لفهم شبكة‎ 

نظرية الالعاب «game theory‏ فسنلقي نظرة سريعة على استراتيجية التحسين Casi Minimax‏ 

فى هذه المقالة» سوف نستكشف شبكات GAIN‏ لتلوين الصور بالأبيض والأسود ونتعرف أيضًا على 
دوال الخطأ المطلوبة لنموذجنا. لذاء استعد لبعض شبكات IGAN‏ 

"[شبكات [GAN‏ هي الفكرة الأكثر إثارة للاهتمام في السنوات العشر الماضية في مجال 

التعلم الآلي" — يان لیکون« مدير Facebook AI‏ 
تتمتع شبكات GAN‏ ببعض التطبيقات المدهشةء مثل تحويل الحصان إلى حمار وحشي» كما هو 


موضح أدناه. 
Zebras <> Horses‏ 


W Y 


horse —> zebra 
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فيما يلى المعمارية الأساسية لشبكات GAIN‏ المستخدمةفي إنشاء وجوه بشرية واقعية: 


Real faces 


Discriminator Fake 


nerator 
Generato Real 


Random noise 


——á 


Generated faces 


لن تتمكن هذه المقالة إلا من إعطائك لمحة عن LASS‏ عمل شبكات GAN‏ حيث سنركز JST‏ على 
حالة الاستخدام بدلاً من الشرح الكامل لكيفية عمل شبكات GAN‏ 


لقد حاولت تلوين الصور باستخدام AutoEncoders‏ من قبل» لکن النتائج لم تكن بالمستوى 
المطلوب. ظهر لون واحدفي الصورة بأكملها بظلال أو صبغات مختلفة. كود المشروع متاح هنا -< 


البيانات والكود 


226 14( تلوين jol‏ بالأبيض والأسود باستخدام à& uin‏ الخصومة التوليدية 


ستتألف مجموعة البيانات الخاصة بنا من 3000 صورة RGB‏ من مجالات مختلفة (الجبال والغابات 
والمدن وما إلى ذلك). يمكنك تحميله من هنا.في «Colab notebook‏ سنقوم بتحويل صور RGB‏ 
هذه إلى تدرج رمادي باستخدام PIL‏ والتي ستكون بمثابة تسميات labels‏ لنموذجنا. 

يمكن العثور على تطبيق TensorFlow‏ لهذا المشروعفي دفتر Colab notebook‏ هذا. 

المولد 

أول شيء ستحتاجه GAN‏ لدينا هو المولد .generator‏ سوف يأخذ هذا المولد صورة ذات تدرج 
رمادي أو أبيض وأسود. ويخرج صورة 68 ۸. سيكون لدى المولد الخاص بنا معمارية مشفر ومفكك 
شفرة encoder- decoder structure‏ مع طبقات موضوعة بشكل c Blaze‏ تماما مثل .UNet‏ 
سيلتقط المشفر encoder‏ صورة ذات تدرج رمادي وينتج تمثيلا CAS‏ لها (يسمى أيضًا تمثيل Ge‏ 
الزجاجة .(bottleneck representation‏ تتمثل مهمة مفكك الشفرة decoder‏ إنتاج صورة 
RGB‏ من خلال توسيع هذا التمثيل الكامن latent representation‏ یتم استخدام هذا الأسلوب 
من قبل معظم شبكات الترميز التلقائي autoencoders‏ بالإضافة إلى هياكل المشفر ومفكك الشفرة 
الأخرى. 

أثناء إنشاء صورة RGB‏ من التمثيل الكامن» قد تكون بعض التفاصيل الدقيقة مفقودة. سيكون من 
المثير للاهتمام ملاحظة النتائج إذا أمكن أن تأتي المعلومات مباشرة من المشفر إلى مفكك الشفرة. هنا 
ee‏ دور تخطي الاتصالات iskip-connections‏ الصورة. 

تقوم اتصالات التخطي بإحضار مخرجات طبقة الالتفاف convolution layer‏ (الموجودةفي 
المشفر) إلى مفكك BAN!‏ حيث يتم ربطها مع المخرجات السابقة لمفكك الشفرة نفسه. 


def get generator model(): 


EE COIS layers., INOUE SMa e> ( AMOS Size p;‏ = 625 لام مك 
ime Size o LI )‏ 

Conv = cic keras leyers- Conyv2D WS , karnel sage 5 g 3 
J) o SLICES | chilarion rars=4 )) ( IOUS ) 

convl = tf.keras.layers.LeakyReLU()( convl ) 

Conv = ciokeces .layecs,Comy2D( 32 y KOMEN size=( 3 p 3 
) o Semicles=_ , Cilartion EES ) ( Conwil ) 

convl = tf.keras.layers.LeakyReLU()( convl ) 

Cony = en karas 118513 COVED 32 , karnel sume-( 9 p 3 
J y CELIO) ( cony J 

convl = tf.keras.layers.LeakyReLU()( convl ) 

(Com, = cic, keras levers CORVZD(, S2 , KOMEN sugme-( 5 gp 3 


) , strides-1)( conv1 ) 
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conv2 = tf.keras.layers.LeakyReLU()( conv2 ) 

Come = tr karas  laysrs Conv2D( 64A , KEEN malee-( 3 g 3 
) , strides-1 )( conv2 ) 

conv2 = tf.keras.layers.LeakyReLU()( conv2 ) 

Come = je oles , layers- Conv2D( 64 , kernel Sage. p 3 
J) „ SON 3 ( COMM )) 

conv2 = tf.keras.layers.LeakyReLU()( conv2 ) 

Cows = wit karas- lewis ,ComyZD( 194. 7 karnel sumet 5 p 9 
J , Sstrides—=1 )( conv2 ) 

conv3 = tf.keras.layers.LeakyReLU()( conv3 ) 

Cony = 22و‎ ees, levers Comv2D( 128 , KOMEL senes 3 y 
3 J) ىن‎ Sessel «mess ) 

conv3 = tf.keras.layers.LeakyReLU()( conv3 ) 

Cony = wie 52315 LEVEES Conv2D( 128 , kernel ue 3 5 
S ) ¢ SLES N ) eeu ) 

conv3 = tf.keras.layers.LeakyReLU()( conv3 ) 

5989135206876 = ti keras. levers Comy2D( 1289 ; karnel size=( 
3, 3) , strides-1 , activation='relu' , padding='same' ) ( 
(oS. ( 

conca _ 1 = ti keras. EAMES 29612628328593 (l I 1596592 5225616 ; 
COWS | J 

Conwy US 3 = CE, keras. layers COMM )كت مت عط لت‎ 126 x 
kernel SavE=( 3 n 3 ) py Sewices=il , actiyeation= reln" )) ( 
COREE i ) 

GOY US 3 = Wit kerag. laysrs o Colwy2Dilcelisyoosxs ( 126 y; 
kernel Sive=( S , 3 ) py Stridee=l , actiyarion= relw" J) | 
conv up 3 ) 

conv up 3 - tf.keras.layers.Conv2DTranspose( 64 , 
kernel sizes 9 y © ) py Srrides=sl , actiyarcion= ied" jq 
GOA bys: S» )) 

EI Mewes. layers (Comcacemece (0) ( || Com Uo 3 y‏ = 2 كتمهم رمم 
Cony | J‏ 

conv up 2 - tf.keras.layers.Conv2DTranspose( 64 , 
kernel sizes 3 م‎ 3 ) py Sexices=i , actiyarcion=" relu jq 
concat 2 ) 

Conv Up 2 = tk keras. layers jConvZDEranspose ( 64 م‎ 
kernel Save=( 3 , 3 J py Semices=il y actiyearcion= relw )) ) 
conv_up 2 ) 

CORY US 2 = طم‎ keras laysrts Com )تكن هرت د ظاائا‎ 3 y 
kernel izes 5 , 9) y Strides=l , actiyeartion= relw" )) | 
conv up 2 ) 

Comecic 3 = wit keras layers- Concarcenacs)( || Conwy US 2 p 


Conv 1 J 
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228 


conv u 
kernel srz 
concat 3 ) 
conv up 1 
kernel eiz ( 
dilation rate- 
1 
( 


conv up _ 
kernel Sube 
dilation rate- 


model 


return model 


tf.keras.layers.Conv2DTranspose( 32 , 
n 5 J | Sae pL Elie 212 IO VI U) ) 
tf.keras.layers.Conv2DTranspose( 32 , 
pn 9 ) n SECON , ae eivat ilon = rel" r 
) ( cony wp 1 ) 
tf.keras.layers.Conv2DTranspose( 3 , 
n © ) n sexes | keel wel! r 
)( cony wo L J) 

tf.keras.models.Model( inputs , conv up 1 ) 


e‏ يمكنك ملاحظة تخطي الاتصالاتني Jo MI‏ 28 335 4385 المقتطف أعلاه. 


المميز 


سيكون discriminator joss!‏ الخاص بنا عبارة عن شبكة CNN‏ القياسية التى نستخدمها 
للتصنيف. سوف يأخذ صورة ويخرج احتمالية ما إذا كانت الصورة المعطاة أصلية أو إذا تم إنشاؤها 


(بواسطة المولد). 
def get discriminator model ():‏ 
layers = [‏ 

CE eels, laysrs Cony2D 32 , kemmel silwve=( To y ) p 
موت‎ 6158-51 , sguuwenbieu" elu" , Toul Shisjoe=( 120 , 120 , 3 
) de 

Bit, Kees LAME E. COVED 32 p karnel sume 75 T) y 
strides-1, activation='relu' Jy 

tf.keras.layers.MaxPooling2D(), 

Erto kerag. lewecs,Comy2D( 4 y kernel size=( 95 9) y 
strides=1, activation='relu' Wi 

Bit ELAS lewis ,Comy2D( O4 , karnel size=( 9, 9) y 
strides-1, activation='relu' 7 

tf.keras.layers.MaxPooling2D(), 

cto kerag laysrs COVED 126 , kernel sweet 3 p 3) 
, Strides-1, activation-'relu' ), 

CE, keras. laysre Conv D 128 kernel sizes 3 , 3) 
, Strides-1, activation-'relu' Na 

tf.keras.layers.MaxPooling2D(), 

rokera laysrs Conyv2DI 250 , kernel salve=( S, 3) 
, Strides-1, activation-'relu' Va 

Bit, koras. layers.ComwZD( 299 , kernel Size=( S , 3) 
, Strides-1, activation='relu' Na 

tf.keras.layers.MaxPooling2D(), 

tf.keras.layers.Flatten(), 

tf.keras.layers.Dense( 512, activation='relu' ) 7 

tf.keras.layers.Dense( 128 , activation='relu' ( , 

tf.keras.layers.Dense( 16 , activation='relu' ) 

tf.keras.layers.Dense( 1 , activation='sigmoid' ) 
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model = tf.keras.models.Sequential( layers ) 
return model 


الرياضيات 
أعلم أن الرياضيات تصبح dase:‏ خاصةفي التعلم SM‏ لكن لا داعي للقلق. سأبقي الأمور بسيطة قدر 
الإمكان. لنفترض أن لدينا عينة ) X, y‏ ) من مجموعة البيانات الخاصة بنا. هنا تمثل X‏ صورة ذات 
ندرج رمادي وستكون y‏ هي نفس الصورة ولكن مع col MI‏ أي بتنسيق RGB‏ أشكال X‏ و y‏ موضحة 
أدناه. 

x — )8,120,120,1( y > (B,120,120,3) 
-batch size حجم الدفعة‎ "B" هنا يمثل‎ 


نحن نمثل المولد بالرمز G‏ والمميز بالرمز (1. وفي خطوة واحدة. سنقوم بتشغيل المولد مرة والمميز 
مرتين. 
yy = ©) 2: (‏ 

P( real | y) - D( y) 

P( real | ملا‎ ( = D( y) 
هي‎ Y هو احتمال أن تكون الصورة المعطاة‎ P(real | y) الصورة التي تم إنشاؤها.‎ y p هنا يمثل‎ 
إلى أن الصورة لم يتم إنشاؤها.‎ "real" الصورة الموجودةفي البيانات. هناء تشير كلمة‎ 
كصورة تم إنشاؤها/مزيفة من المولد. قد نستخدم هذه المصطلحات‎ y p حقيقية و‎ y يمكننا أن نعتبر‎ 
GAN كما ستجدفي معظم الموارد التي تشرح شبكات‎ 
يتم‎ -MSE سنستخدم دالة الخطأ‎ yal بالنسبة‎ ol الآن دعونا نلقي نظرة على دوال الخطأ.‎ 
حالتنا.‎ QUAS الانحدار. ولكن يمكننا استخدامه‎ dele استخدامه بشكل‎ 

MSE(z,y,)‏ حبرا 


في المعادلة أعلاه. p‏ لإ هي الصورة التي تم إنشاؤها و× هي الصورة المدخلة. دوال الخطأ للمميز مبينة 
أدناه. نحن نستخدم id‏ الإنتروبيا المتقاطعة الثنائية binary cross-entropy loss‏ لكلا مخرجات 
Sell‏ 
Lp = log( D( y ) )‏ 
Li} =log(1— D( wp ))‏ 
نضيف دوال الخطأ هذه للحصول على التعبير النهائي لدالة الخطأ للمميز: 


Yp 


Lp = L} + LS 
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= log( D( y )) -log( 1— D( yp ) ) 


e‏ يشير J| Minimax‏ استراتيجية التحسينفي الألعاب القائمة على تبادل الأدوار بين لاعبين 
لتقليل الخطأ أو التكلفة لأسوأ حالة للاعب الآخر. هناء المولد والمميز هما اللاعبان اللذان 
يتنافسان ضد بعضهما البعض. 

e‏ بالنسبة للمميزء فإن تعظيم خطأهما يعني تصنيف الصور التي تم إنشاؤها (y p)‏ بدقة 
بالإضافة إلى إنتاج احتمالية جيدة (أقرب إلى 1.0) للصور (y)‏ من مجموعة البيانات. 


max [ log( D(y))-*log(1— D(y,))] 


٠‏ المولد. من خلال تقليل خطأه. يعمل على تحسين نفسه إلى الحد الذي يمكنه من خداع 
المميّز. خداع المميّز يعني أن المَميّز سينتج احتمالات (أقرب إلى 1.0) حتى بالنسبة للصور 
التي تم إنشاؤها (y p)‏ 
min MSE(z, G( z))‏ 
سنقوم بتدريب المميز بطريقة تجعل احتمالات الإخراج أقرب إلى 1.0 للصور الحقيقية (من مجموعة 
البيانات الخاصة بنا) واحتمالات الإخراج أقرب إلى 0.0 للصور القادمة من المولد. 
إذاكان المميز "ذكي" بدرجة كافية» فسوف تنتج احتمالات أقرب إلى 1.0 للصور الحقيقية (القادمة من 
مجموعة البيانات الخاصة بنا). لذلك» نحن نقوم بتدريب المولد الخاص بنا على صياغة مثل هذه 
الصور الواقعية التي ستجعل احتمالات إخراج est‏ أقرب إلى 1.0 حتى عندما تكون الصور مزيفة 
(ليس من مجموعة البيانات الخاصة بناء ولكن من المولد). 
ستكون دالة الخطأ النھائی لدينا هى: 
min max [log( D( y) ) Hlog( 1— D( yp)) + MSE( zx, G(x))|‏ 


هذا كل شيء! سنتوجه الآن نحو التعليمات البرمجية لتدريب GAN‏ 


الكود 
لقد رأينا تنفيذ Keras‏ للمولد والمميزفي المقتطفين 1 و2. OV‏ دعونا نلقي نظرة على تنفيذ Jl»‏ 
الخطأً. 


cross entropy = tf.keras.losses.BinaryCrossentropy () 
mse = tf.keras.losses.MeanSquaredError )( 


def discriminator loss(real output, fake output): 
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zeal logs = Cross entropy OES likel(real output) = 
tf.random.uniform( shape-real output.shape , maxval-0.1 ) , 
real output) 

rele logs = Gross entropy (cic. Zeros Liksltaks quje) ar 
tf.random.uniform( shape=fake output.shape , maxval-0.1 ) , 
fake output) 

toral loss = zeal LOSS ar Take LOSS 


EEUU toral LOSS 


def generator loss(fake output , real y): 
real y = wi Cast real y , Vileses2" ) 
return meel taks ourtou ; zeal y ) 


generator optimizer = tf.keras.optimizers.Adam( 0.001 ) 
discriminator optimizer = tf.keras.optimizers.Adam( 0.001 ) 


هل لاحظت Éd‏ مختلمًاني المقتطف أعلاه.في السطرين 5 $65 


نحن نقوم بإضافة/طرح قيم عشوائية صغيرة من tE zeros; thones‏ لذاء بدلاً من استخدام التصنيفات 
الثابتة مثل 1 Oy‏ نستخدم تسميات مشوشة مثل 0.12 أو 0.99. يساعد هذا aal‏ على التعلم بشكل 
أفضل وإلا فإنه سيقترب من 1 أو 0 الفترات الأولية ولن يحدث أي تعلم. 


نستخدم محسن Adam‏ لكل من المولد والمميز بمعدل تعلم learning rate‏ قدره 0.001. 
التالي Sh‏ حلقة التدريب. ستقوم حلقة التدريب بإنشاء تنبؤات» سواء من المولد أو المّميزء وحساب 


@tf£.function 
der rrain Stee impone Xx p zeal y Js 


wita El Gracienciapel) as gem cape, wie -GrachientTteaps() as 
Ciise tapas 
# Generate an image -> G( x ) 
generated images = generator( input x , 
training-True) 
# Probability that the given image is real -> D( x ) 
real xeybhepowbhe = Chiseislmaliseheese ) real Wy iwieelsbmaline Seu) 
# Probability that the given image is the one 
generated -> D( G( x ) ) 
generated output = discriminator (generated images, 
training=True) 


# MSE 
gen loss = generator loss( generated images , real y 


# Log loss for the discriminator 
Chiese loss = cliscinlmimecon Joss ( real oleic, 
generated output ) 
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*tf.keras.backend.print tensor( tf.keras.backend.mean ( 
gem loss J ) 
EL 12528. beckend prine tengorl Gen loss sr CSE lass ) 


# Compute the gradients 
gradients of generator = gen tape.gradient(gen loss, 
generator.trainable variables) 
gradients of discriminator - 
disc tape.gradient(disc loss, 
discriminator.trainable variables) 


# Optimize with Adam 


generator optimizer.apply gradients(zip(gradients of generat 
or, generator.trainable variables)) 


discriminator optimizer.apply gradients (zip(gradients of dis 
criminator, discriminator.trainable variables)) 


نحن الآن على استعداد لبدء التدريب. تتم طباعة قيم الخطأ لكل تمريرة للأمام. 
num epochs - 60‏ 


EOE 3 in rangel mum epochs )s 
prine "loch " | €) 
for (x ,y) in dataset: 
# Here ( x , y) represents a batch from our 
training dataset. 
train SES p» X) 


النتائج 
النتائج جيدة جد وتظهر القوة المذهلة لشبكات GAN‏ لكنك ستشاهد بعض الإزعاج (البقع ذات 
اللون الأسود/ الأصفر المتميزة عن خلفيتها)ني الصور أدناه. 


1000 3 x 
0 No 4 @ MO wo 


Generated image Original RGB image Original Grayscale image 


لقد حصلنا أيضًا على بعض النتائج المفاجئة حيث تم تحويل النهار إلى المساء ‏ ولم ندرب النموذج 


200 


400 


600 


800 


1000 


على ذلك! 


400 


600 


B00 


1000 


200 400 600 800 


Generated Original 


200 200 


400 
600 


600 


800 800 


1000 1000 


0 200 400 600 800 1000 200 400 800 800 1000 


Generated Original 


234 14( تلوين jol‏ بالأبيض والأسود باستخدام à& ui‏ الخصومة التوليدية 


gui T 


حقاء تتمتع شبكات GAN‏ بالقدرة على تغيير وجه التعلم igo ll‏ وكما قلت سابقاء فهي مرنة ويمكن 
استخدامها لحل المشكلات المختلفة. هل تتساءل أين يمكننا استخدام شبكات TGAN‏ 


تم استخدام شبكات GAN‏ للحصول على دقة فائقة للصور. وهنا نقوم بتحويل صورة منخفضة الدقة 
إلى صورة عالية الدقة كما هو موضح أدناه. 


يمكن لشبكات GAN‏ (بشكل أكثر دقة (CycleGANs‏ إنشاء لوحات وأعمال فنية تشبه الإنسانء 
كما هو موضح أدناه. 


c ^ PRI - 
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